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Resume 


Etude et Moderation de la Biosynthese des Antibiotiques a partir de Differentes Souches 

Productrices - Cas de Pleuromutiline 


L’objectif de cette these vise a developper des methodologies basees sur les reseaux de 
neurones pour la modelisation des bioprocedes et ceux pour un but de prediction et d’optimisation. 

Notre premiere contribution a porte sur futilisation des reseaux de neurones pour la 
modelisation du processus de fermentation fed-batch de pleuromutiline et ceux dans le but de 
predire revolution des parametres difficilement mesurables on line (biomasse, substrat et produit) a 
partir de variables facilement mesurables. Pour cela, trois modeles neuronaux de type feedforward 
ont ete construits et optimises. Ces modeles se caracterisent par une structure similaire : cinq 
neurones dans la couche d’entree (temps de fermentation, pH , indice de refraction et concentration 
initiale d'inoculum et concentration initiale du substrat), une couche cachee avec un nombre de 
neurones optimise au cours du processus d’apprentissage et un neurone dans la couche de sortie 
(biomasse, consommation du sucre ou formation du produit). Une bonne concordance entre les 
valeurs experimentales et les valeurs predites pour chaque modele neuronal a ete obtenue (les 
racines des erreurs quadratiques moyennes pour la base de test etaient respectivement de 0,4624%, 
de 0,1234 g/L et de 0,0016 mg/g pour le reseau de neurones decrivant la biomasse, la 
consommation du substrat et la formation du produit). Par ailleurs, la comparaison entre les 
modeles neuronaux optimises et les modeles cinetiques non structures a demontre la superiorite des 
modeles neuronaux. En plus de l’excellente correlation des donnees experimentales, les trois 
modeles neuronaux utilises ont montre une bonne capacite predictive d’ interpolation. 

Notre deuxieme contribution a porte sur le developpement d’une methodologie 
d’optimisation, combinant un plan composite centre (PCC), un reseau de neurones artificiel (RN) et 
un algorithme d'optimisation par essaim de particules (OEP). Cette technique a ete appliquee a 
l’optimisation des conditions de culture de Pleurotus mutilus (vitesse d'agitation, temperature et pH) 
et ceux dans le but d’obtenir une production maximale en pleuromutiline. Le PCC et le RN ont ete 
utilises respectivement pour planifier et concevoir fexperience et pour modeliser le processus. 
L’algorithme d’OEP a ete applique pour deux fins : remplacement de la retro -propagation standard 
dans l’apprentissage du reseau de neurones et P optimisation du modele neuronal obtenu. La 
comparaison entre le modele neuronal forme avec 1’algorithme d’OEP (RNOEP), le reseau de 
neurones forme avec l’algorithme de regularisation bayesienne (RNRB) et le modele quadratique de 
la methodologie des surfaces de reponse (MSR) a demontre la grande capacite de modelisation des 
modeles neuronaux. Par la suite, un algorithme generique d’OEP a ete utilise pour optimiser 
l’espace d’entrees des modeles neuronaux (RNOEP et RNRB). En vertu de l’optimisation du 
modele RNOEP, les niveaux optimaux des conditions de culture obtenus sont: une vitesse 
d'agitation de 242 tr/min, une temperature de 26,88 °C et un pH de 6.06. Par consequent, une 
production de 10074 ± 500 pg/g qui est en tres bon accord avec la prediction (10149 pg/g), a ete 
observee dans fexperience de verification. L’optimisation du modele RNOEP (10074 pg/g) a donne 
un rendement de 27,5 % superieure a celui obtenue par l’optimisation du modele RNRB (7900 
pg/g) demontrant ainsi la superiorite de la methodologie developpe. 


Mots cles : Fermentation, Pleuromutiline, Modelisation, Prediction, Optimisation, Reseau de 
Neurones, Algorithme d’Optimisation par Essaim de Particules. 





Summary 


Study and Modeling of the Biosynthesis of Antibiotics from Different Producing Strains - 

Case of Pleuromutilin 


The objective of this thesis is to develop methodologies based on neural networks for 
modeling bio processes and for those purposes of prediction and optimization. 

Our first contribution is focused on the use of neural networks for modeling the process of 
fed-batch fermentation of pleuromutilin and those in order to predict the evolution of parameters 
that are difficult to measure online (biomass, substrate and product) from easily measurable 
variables. For this purpose, three feed-forward neural models were built and optimized. These 
models are characterized by a similar structure: five neurons in the input layer (fermentation time, 
pH , refractive index, initial inoculum concentration and initial substrate concentration), a hidden 
layer with a number of neurons optimized during the learning process, and one neuron in the output 
layer (biomass, sugar consumption, or product formation). For each model, a good agreement 
between experimental and predicted values was obtained (root mean square errors for the test set 
were 0.4624%, 0.1234 g/L and 0.0016 mg/g for the neural network describing biomass, substrate 
consumption and product formation, respectively). Moreover, the comparison between the 
optimized neural models and the unstructured kinetic models showed the superiority of neural 
models. In addition to the excellent correlation of the experimental data, the three neural models 
used showed good predictive ability of interpolation. 

Our second contribution is focused on the development of an optimization methodology, 
combining central composite design (PCC), artificial neural network (RN) and particle swarm 
optimization algorithm (OEP). This technique has been applied in optimizing the culture conditions 
of Pleurotus mutilus (stirring speed, temperature and pH) and those in order to obtain maximum 
pleuromutilin production. The PCC and the RN were respectively used to plan and design 
experience and to model the process. The OEP algorithm was used for two purposes: replacing the 
standard back-propagation in the learning of neural network and optimization of the obtained neural 
model. The comparison between the neural model trained with OEP algorithm (RNOEP), the neural 
network trained with Bayesian regularization algorithm (RNRB) and the quadratic model of 
response surface methodology has demonstrated the modeling capacity of neural models. 
Subsequently, a generic OEP algorithm was used to optimize the input space of neural network 
models (RNOEP and RNRB). Under the optimization of RNOEP model, the optimal levels 
obtained of culture conditions are: 242 rpm for the agitation speed, a temperature of 26.88 ° C and a 
pH of 6.06. Consequently, a production of 10 074 ± 500 pg/g, which is in good agreement with the 
prediction (10149 pg/g) was observed in the verification experiment. The optimization of the 
RNOEP model (10074 pg/g) gave a yield of 27.5% higher than that obtained by optimizing the 
RNRB model (7900 pg/g), thus demonstrating the superiority of the developed methodology. 


Keywords: Fermentation, Pleuromutilin, Modeling, Prediction, Optimization, Neural Network, 
Particle Swarm Optimization Algorithm. 
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Dans un marche mondial d’antibiotique de plus en plus concurrentiel et face aux contraintes 
economiques, environnementales et de security, les industriels doivent augmenter leur production 
d'antibiotiques quantitativement et qualitativement et reduire leurs couts et leur consommation 
d’energie. Par consequent, une modelisation du processus qui reste toujours un probleme difficile en 
raison de la complexity et de la non-linearite du phenomene s’averent necessaire (Potocnik et 
Grabec 1999). 

Les modeles peuvent etre utilises pour soutenir famelioration des bioprocedes par de 
nombreuses fagons differentes : prediction, controle, optimisation, capteurs logiciels ou 
reconnaissance de formes. Dans le present travail finteret est consacre aux aspects lies a la 
prediction et a foptimisation du processus de fermentation de la pleuromutiline, qui est un produit 
naturel, obtenu par la fermentation de Pleurotus mutilus , un champignon comestible. Ce compose 
est actif contre une variete de bacteries gram-positives et de mycoplasmes et est un inhibiteur de la 
synthese proteique bacterienne (Kavanagh et al. 1951; Egger et Reinshagen 1976). D’autre part, la 
pleuromutiline a servi de structure principale dans le developpement de plusieurs antibiotiques 
commerciaux comme tiamulin et valnemulin utilise dans la medecine veterinaire (Hannan et al. 
1997) et retapamulin approuve pour le traitement de problemes de peau humaine (Hirokawa et al. 
2008). 


Dans l’approche conventionnelle de modelisation en bioprocedes, on trouve les modeles 
cinetiques. Ces modeles, connus comme une strategic de boite blanche, fournissent une expression 
analytique reliant les caracteristiques cles du systeme physique a son comportement dynamique. 
Dans la modelisation cinetique, les valeurs des parametres du modele ont une signification 
physique, contiennent toujours les consequences des suppositions introduites et des simplifications 
du fait de la complexity du cycle de fermentation. Ces modeles ont ete et sont encore largement 
utilises dans les precedes de fermentation (Paul et Thomas 1996; Zangirolami et al. 1997; Cruz et 
al. 1999; Benkortbi et al. 2007). Toutefois, dans certains cas, ces modeles ne s'appliquent pas, en 
raison de la non-linearite inherente du systeme, le manque de donnees experimentales, 
l’inexactitude experimentale, ou les ecarts aux conditions ideales (Feyo de Azevedo et al. 1997; 
Silva et al. 2008; Saraceno etal. 2009). 

Dans Tapproche courante d’ optimisation en bioprocedes et a afin d’obtenir la meilleure 
performance des procedes de fermentation, des strategies d'optimisations diverses de ces processus, 
allant de la methode conventionnelle de manipulation sequentielle d’un facteur a la methodologie 
des surfaces de reponse (MSR), ont ete generees par les scientifiques. La methode conventionnelle 
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d’ optimisation par manipulation sequentielle d’un seul parametre est non seulement laborieuse et 
prend du temps (Kim et al. 2005; Desai et al. 2006; Desai et al. 2008; Xiong et al. 2008), mais 
ignore egalement les interactions combinees de chaque facteur (Kalil et al. 2000; Burkert et al. 
2004; Gao et al. 2009). Sous la methodologie des surfaces de reponse, un modele polynomial 
quadratique, representant feffet d'interaction entre les variables, est generalement construit pour les 
processus / variables defmies. Bien que la MSR presente de nombreux avantages et elle a ete 
appliquee avec succes pour etudier et optimiser plusieurs processus de fermentation (Banik et al. 
2007; Gao et al. 2009), il est difficile de dire qu'elle est generalisable a toutes les etudes de 
modelisation et d'optimisation (Ba§ et Boyaci 2007). 

Ces deux problematiques nous ont amene a envisager une modelisation non conventionnelle 
en faisant appel aux reseaux de neurones artificiels. A l’heure actuelle, les reseaux de neurones 
(RN) constituent une alternative interessante dans la modelisation des processus non lineaires et tres 
complexes. La litterature dediee fait largement etat d’applications ou les RN offrent des solutions 
efficaces pour une large gamme de problemes de fermentation, dont certains sont difficiles a traiter 
par les approches classiques (Tompos et al. 2007; Desai et al. 2008; Singh et al. 2008; Zhang et al. 
2010; Dragoi et al. 2013; Nasr et al. 2013). 

En plus, fespace d'entree du modele quadratique de la MSR peut etre facilement optimise en 
utilisant des methodes basees sur les gradients. Les modeles neuronaux etant exclusivement bases 
sur des donnees, ne peuvent pas etre garantie comme etant lisse. Par consequent, les methodes 
classiques d’optimisation basees sur les gradients, qui necessitent que la fonction objective soit 
continue, derivable et surtout lisse, ne peuvent pas etre utilises efficacement pour optimiser fespace 
d'entree d'un modele neuronal. Recemment, 1’ optimisation par essaim de particules (OEP) a evolue 
comme une branche alternative importante des techniques stochastiques pour explorer fespace de 
recherche dans les problemes d’optimisation. 

En effet, l’optimisation par essaim de particules (OEP) est une meta-heuristique recente 
developpee en 1995 par l’ingenieur electrique Russell Eberhart et le sociologue James Kennedy 
(Eberhart et Kennedy 1995). Cet algorithme a ete applique avec succes dans l’apprentissage des 
reseaux de neurones (Shen et al. 2006; Zhang et al. 2007; Lazzus 2009) et dans la resolution de 
divers problemes d'optimisation mono-objectif, multi-objectif, a variables discretes ou a variables 
continues (Cockshott et Hartman 2001; Huang et al. 2007; Liu et al. 2009). Compare a d’autres 
algorithmes evolutionnaires comme les algorithmes genetiques, Ealgorithme d’OEP presente des 
proprietes interessantes telles que : mise en ouvre facile, efficacite de calcul, de memoire et une 
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cooperation constructive entre les individus, il est done plus probable et plus rapide d’affluer dans 
le domaine des meilleures solutions et de trouver rapidement des resultats optimaux (Eberhart et 
Kennedy 1995; Cockshott et Hartman 2001). 

Le premier objectif de ce travail est V application des RN de type feedforward pour 
modeliser la production industrielle de pleuromutiline en mode fed-batch et ceux dans le but de 
predire et d’evaluer les variables difficilement mesurables on line, a savoir la bio masse, la 
consommation du substrat et la formation du produit, a partir des variables facilement mesurables. 
Notre deuxieme objectif porte sur la presentation d’un couplage entre un reseau de neurones de type 
feedforward et ralgorithme d’OEP. Ce couplage a ete applique a l’optimisation des conditions de 
cultures de Pleurotus mutilus en mode batch et ceux dans le but d’obtenir une production maximale 
en pleuromutiline. 

La presente these s’ organise en quatre chapitres : 

Le premier chapitre est dedie a la presentation de la theorie des reseaux de neurones. Apres 
avoir expose un apergu historique sur les RN, nous detaillons les differents elements de base de cet 
outil mathematique. Nous limitons notre presentation a des aspects qui sont utiles pour la suite de ce 
travail. Une synthese sur les principaux travaux utilisant les RN en bioprocedes est presentee a la 
fin de ce chapitre. 

Dans le deuxieme chapitre, consacre a la methodologie d’ optimisation par essaim de 
particules (OEP), nous donnons dans un premier temps un apergu sur les modeles historiques 
relatifs a l’OEP. Nous poursuivons en exposant ralgorithme de base de l’OEP (description 
mathematique, etapes de ralgorithme et les caracteristiques principales). Ensuite nous passons en 
revue le confinement des particules, la topologie du voisinage ainsi que les differentes variantes de 
Lalgorithme. Nous terminons ce chapitre par la presentation des divers travaux relatant de 
l’application de l’algorithme en bioprocedes. 

Nous presentons dans le troisieme chapitre 1’ application des RN pour la modelisation de la 
fermentation fed-batch de pleuromutiline. Pour cela, nous abordons en premiere partie les materiels 
et methodes utilises : Nous examinons d’abord la base de donnees collectee, puis nous presentons la 
procedure de developpement et d’ optimisation de 1’ architecture des trois modeles neuronaux de 
type feedforward employes respectivement pour decrire la croissance microbienne, la 
consommation du substrat et la formation du produit. Par la suite, une comparaison des trois 
modeles neuronaux optimises avec les modeles cinetiques est illustree. Enfin, une analyse de 
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sensibilite par deux methodes differentes est appliquee aux trois reseaux. Dans la deuxieme partie 
de ce chapitre, les differents resultats prometteurs obtenus sont discutes : Dans un premier temps, 
nous presentons les architectures optimales des modeles neuronaux, leurs performances de 
prediction ainsi que leurs temps d’ execution. Ensuite, apres 1’ extraction de formules mathematiques 
a partir de ces modeles et la presentation des resultats de comparaison, nous etudions leurs 
performances d’ interpolation. Les resultats de l’analyse de sensibilite sont presentes a la fin de cette 
deuxieme partie. 

Le dernier chapitre est consacre a la methodologie hybride d’optimisation. La premiere 
partie de ce chapitre aborde les materiels et les differentes techniques utilisees lors du suivi des 
experiences de fermentation ; Dans un deuxieme temps, nous presentons les differents modeles 
predictifs adoptes, la mise en oeuvre de 1’algorithme d’OEP et les differents logiciels utilises ; la 
partie qui suit est consacree a la discussion des resultats significatifs obtenus. La derniere partie 
illustre une comparaison de fourchette entre la methodologie hybride proposee et d’autres 
methodologies d’optimisation a base des RN existant dans la litterature. 

Les conclusions tirees de ce travail ainsi que les etudes qui peuvent etre envisagees a 
l’avenir sont presentees a la fin de cette these. 
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Chapitre I. Les reseaux de neurones 


1.1. Introduction 

Les reseaux de neurones connaissent depuis quelques annees un succes croissant dans divers 
domaines des sciences de l’ingenieur, celui du genie des procedes n’echappe pas a cette regie. Dans 
ce chapitre, nous nous interessons a P application des reseaux de neurones aux bioprocedes. 

Dans un premier temps, nous rappelons les definitions et notations de bases relatives aux 
reseaux de neurones. Nous poursuivons en exposant les types et la methodologie d’apprentissage. 

Nous presentons aussi, d’une maniere generate, les etapes de conception d’un reseau de 
neurones : le choix des entrees et des sorties, 1’ elaboration de la base de donnees et de la structure 
du reseau... etc. 

Nous terminons ce chapitre par la presentation de diverses applications qui sont destinees a 
montrer que dans le domaine des bioprocedes, les reseaux de neurones sont susceptibles d’apporter 
des solutions efficaces et elegantes. 

1.2. Historique 

En 1943, Mac Culloch et Pitts ont propose le premier modele de neurone biologique (Davalo 
et Naim 1989). Ce dernier, appele aussi neurone a seuil, a ete inspire des recentes decouvertes en 
biologie. Ce sont des neurones logiques (0 ou 1). Ces deux physiciens ont montre que les neurones 
formels peuvent realiser des fonctions logiques. 

En 1949, le psychologue Donald Hebb a introduit, dans son ouvrage "The Organization of 
Behavior”, le terme connexionisme pour parler des modeles massivement paralleles et connectes. II 
a propose de nombreuses regies de mise a jour des poids dont la plus connue a cette epoque est la 
’’regie de Hebb" (Hebb 1949; Davalo etNaim 1989). 

En 1958, le psychologue Frank Rosenblatt a developpe le modele du perceptron (Rosenblatt 
1958). II s’agit d’un reseau de neurones, capable d’apprendre a differencier des formes simples et a 
calculer certaines fonctions logiques. II est inspire du system e visuel. II a reussi a l’appliquer dans 
la reconnaissance des formes. Au debut des annees 60, les travaux de Rosenblatt ont vecu un grand 
interet dans le milieu scientifique. Mais en 1969, deux scientifiques americains appeles Minsky et 
Papert (Minsky et Papert 1969; Davalo et Naim 1989) ont publie un livre dans lequel ont demontre 
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les limites du perceptron propose par Rosenblatt. En particular, son incapacity reside a la resolution 
des problemes non lineaires. 

Les travaux se sont ralentis considerablement jusqu’aux annees 80. En 1982, Hopfield a fini 
par demontrer l’interet des reseaux entierement connectes (Hopfield 1982; Davalo et Nairn 1989). 
Parallelement, Werbos a congu un mecanisme d’apprentissage pour les reseaux multicouches de 
type perceptron : la retro-propagation (en anglais back-propagation). Cet algorithme, qui permet de 
propager l’erreur vers les couches cachees, sera popularise en 1986 dans un livre "Parallel 
Distributed Processing" par Rumelhart et McClelland (Rumelhart et McClelland 1986). 

En 1989 Moody et Darken (Moody et Darken 1989) exploitent quelques resultats de 
E interpolation multi variables pour proposer le Reseau a Fonctions de base Radiales (RFR), connu 
sous l’appellation anglophone "Radial Basis Function network" (RBF). Ce type de reseau se 
distingue des autres types de reseaux de neurones par sa representation locale (Talbi 2011). 

Depuis ces travaux, les applications des reseaux de neurones n’ont cesse de croitre. Les 
applications en sont multiples et variees. 

1.3. Notions de base sur les reseaux de neurones 

1.3.1. Du neurone biologique au modele mathematique 

1.3. 1.1 . Le modele neurophysiologique 

Le cerveau humain est compose de cellules distinctes appelees neurones formant un 
ensemble dense d’environ 10 a 100 milliards d’unites interconnectees. Tel qu’illustre sur la figure 
LI, le neurone est une cellule composee d’un corps cellulaire et d’un noyau. Le corps cellulaire se 
ramifie pour former ce que Ton nomme les dendrites. C’est par les dendrites que Tinformation est 
acheminee de Texterieur vers le soma (corps du neurone). 

L’information est traitee alors par le corps cellulaire. Si le potentiel d’action depasse un 
certain seuil, le corps cellulaire repond par un stimulus. Le signal transmis par le neurone est 
chemine ensuite le long de l’axone (unique) pour etre transmis aux autres neurones. La transmission 
entre deux neurones n’est pas directe. En fait, il existe un espace intercellulaire de quelques dizaines 
d’Angstroms entre Taxone du neurone afferent et les dendrites du neurone efferent. La jonction 
entre deux neurones, comme schematise sur la figure 1.2, s’appelle synapse (Tzanakou 2000). 
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Figure 1.1. Schema d’un neurone (Talbi 2011). 


element 

presynaptique 


vesicule 

synaptique 




fente synaptique 



element post synaptique 


Figure 1.2. Schema d’une synapse (Talbi 2011), 
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1.3. 1.2 Le modele mathematique 

Par analogie avec le neurone biologique, chaque neurone artificiel est un processeur 

A 

elementaire. II regoit un nombre variable d'entrees en provenance de neurones en amont. A chacune 
de ces entrees est associe un poids w, abreviation du mot poids (weight en anglais), representatif de 
la force de la connexion. Chaque processeur elementaire est dote d’une sortie unique qui se ramifie 
ensuite pour alimenter un nombre variable de neurones en aval tel qu’illustre sur la figure 1.3 
(Haykin 1999). A chaque connexion est associe un poids. 



Figure 1.3. Neurone formel (Talbi 2011). 

Le comportement du neurone artificiel se compose de deux phases (Haykin 1999) : 

1. La premiere phase represente le pretraitement des donnees regues en calculant la somme 
ponderee des entrees selon fexpression suivante : 

a , = L w 'i x j ( L1 ) 

j 

2. Dans la deuxieme phase, une fonction de transfert calcule la valeur de l'etat interne du 
neurone. C'est cette valeur qui sera transmise aux neurones en aval. Plusieurs possibility 
existent pour specifier la nature de la fonction d’ activation du modele. Les fonctions 
mathematiques les plus souvent utilisees sont regroupees dans le tableau 1.1. A la difference 
des neurones biologiques dont fetat est binaire, la plupart des fonctions de transfert sont 
continues, offrant une infinite de valeurs possibles comprises dans fintervalle [0, +1] ou [-1, 
+1]. Ainsi, le neurone peut etre defini mathematiquement comme etant une fonction 
algebrique, a priori non lineaire (suivant la fonction d’ activation f) et bornee, avec des 
entrees x et parametree par les poids wij. 
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Tableau LI. Fonctions de transfer! usuelles, a=f(n) (Si-Moussa 2009). 


Nom de la fonction 

Relation 
entree / sortie 

Graphe de la 
fonction 

Fonction MATLAB® 
correspondante 

Seuil 

a = 0 si n < 0 
a =1 si n > 0 

1 

7 

N + i 

hardlim 




o 



-1 

Seuil symetrique 

a = — 1 si n < 0 
a =1 si n > 0 


a 

A+l 

hardlims 


o >fl 



1 -I 

Lineaire 

a = n 

a 

/ 


purelin 



/ 

o > 

/ 

-i 

Lineaire saturee 

a = 0 si n < 0 
a = n si 0 < n <1 

a 

A 

+i , 

satlin 


r ! ^ n 

a =1 si n > 1 

-1: 

i 

• 

0 +1 > 


-1 

Lineaire saturee 
symetrique 

a = — 1 si /7 < — 1 
a = n si — 1< « <1 
a= 1 sin>l 

i 

i 

\ + l 

satlins 


y • n 

-i| y 

0+1 


-1 

Lineaire positive 

ri =. 0 Cl 11 < 0 

a 

J 

Wi: 

poslin 

Li' \J ol / i 

a — n si n > 0 


/I >B 


o 1 > 


-1 

Logistique 

(Sigmoi'de 

logarithmique) 

i 

n — 

> 

a 

^+1 

logsig 


- // 

CL 

1 . ~ n 

1 + e 



0 > 


-1 

Tangente hyperbolique 

+n -« 

e -e 
a = 

+« i 

e + e 

/ 

a 

M 

tansig 




o > 


-I 

Triangulaire de base 

a = \- n , -1 < n < +1 
a = 0, autrement 
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1.3.2. Architecture des reseaux de neurones 

On distingue deux grandes families de reseaux de neurones : les reseaux boucles et les 
reseaux non boucles (Figure 1.4). 



Figure 1.4. Reseaux de neurones les plus utilises (Talbi 201 1). 

13.2.1 . Reseau de neurones non boucle (en anglais feedforward) 

Un reseau de neurones non boucle est done represente graphiquement par un ensemble de 
neurones connectes entre eux, l’information circulant des entrees vers les sorties sans "retour en 
arriere" (Bishop 1995). On constate que le graphe d’un reseau non boucle est acyclique. En effet, si 
on se deplace dans ce type de reseau a partir d’un neurone quelconque en suivant les connexions, on 
ne peut pas revenir au neurone de depart. Les neurones qui effectuent le dernier calcul de la 
composition de fonctions sont les neurones de sortie. Ceux qui effectuent des calculs intermediate s 
sont les neurones caches (Figure 1.5). 

Les reseaux non boucles a couche sont structures tel que les neurones qui appartiennent a 
une meme couche ne soient pas connectes entre eux, chacune des couches recevant des signaux de 
la couche precedente et transmettant le resultat de ses traitements a la couche suivante. Les deux 
couches extremes correspondent a la couche d’ entree qui regoit ses entrees du milieu exterieur 
d’une part et a la couche de sortie qui fournit le resultat des traitements effectues d’autre part. Les 
couches intermediates sont appelees couches cachees, leur nombre est variable (Chamekh 2007). 
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Figure 1.5. Structure d’un reseau de neurones non boucle (Chamekh 2007). 


1.3. 2. 2. Reseau de neurones boucle (ou recurrent) 

Un reseau de neurones boucle est schematise par un graphe de connexions qui est cyclique. 
Lorsqu’on se deplace dans le reseau en suivant le sens des connexions, il est possible de trouver au 
moins un chemin qui revient a son point de depart (un tel chemin est designe sous le terme de 
’'cycle”). Ainsi, un retard entier multiple de l’unite de temps choisie est attache a chaque connexion 
d’un reseau de neurones boucle (ou a chaque arrete de son graphe). Une grandeur a un instant donne 
ne peut pas etre fonction de sa propre valeur au meme instant. Tout cycle du graphe du reseau doit 
avoir un retard non nul (Chamekh 2007). 


La figure 1.6 represente un exemple de reseau de neurones boucle. Les chiffres dans les 
carres indiquent le retard attache a chaque connexion, exprime en multiple de l’unite de temps. Ce 
reseau contient un cycle, qui part du neurone 3 et revient a celui-ci en passant par le neurone 4. La 
connexion de 4 vers 3 ayant un retard d’une unite de temps. 



Figure 1.6. Un reseau de neurones boucle a deux entrees (Chamekh 2007). 
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1.3.3. Types cP apprentissage des reseaux de neurones 

L'apprentissage est vraisemblablement la propriety la plus interessante des reseaux de 
neurones. L’apprentissage est une phase du developpement du reseau de neurones durant laquelle 
on calcule les poids des neurones de telle maniere que les sorties du reseau soient aussi proches que 
possible des sorties desirees. Les procedures d’apprentissage sont divisees, elles aussi, en deux 
grandes categories : apprentissage supervise et apprentissage non supervise (Hassoun 1995). 

1.33.1. Apprentissage supervise 

L’apprentissage supervise implique l’existence d’un professeur qui a pour role d’evaluer le 
succes (ou l’echec) du reseau quand il lui est presente un stimulus connu (on dit que ce stimulus est 
un exemple appartenant a la base d’apprentissage). Cette supervision consiste a renvoyer au reseau 
une information lui permettant de faire evoluer ses connexions (parfois aussi sa propre architecture) 
afin de faire diminuer son taux d’echec. L’information peut etre explicite, sous la forme d’une 
mesure de l’erreur commise, par exemple, ou globalement sur 1’ ensemble des exemples de la base. 
C’est ce qui se passe dans le cas du perceptron. Mais elle peut etre plus implicite (apprentissage par 
renforcement), sous forme d’une simple appreciation (bon ou mauvais, punition ou recompense), 
sans mesure d’erreur et meme etre globale, sur l’ensemble des taches que le reseau doit executer. 
Dans ce dernier cas, il est facile de comprendre que l’apprentissage est le plus difficile, la difficulty 
majeure consistant pour le reseau a identifier les etapes du processus qui sont responsables de 
l’echec ou du succes (Hassoun 1995). 

1.3. 3.2. Apprentissage non supervise 

L’apprentissage non supervise implique la fourniture a un reseau autonome d’une quantity 
suffisante d’ exemples contenant des repetitions (autrement dit de la redondance), telles que celui-ci 
en degage les regularites automatiquement. Ces reseaux sont souvent appeles auto-organisateurs, ou 
encore a apprentissage competitif. Dans l’apprentissage non supervise, les donnees ne contiennent 
pas d’ informations sur une sortie desiree, il n’y a pas de superviseur ou expert humain. Il s’agit de 
determiner les parametres du reseau de neurones suivant un critere a definir. Dans ce cas, les 
exemples presentes a 1’ entree provoquent une auto adaptation du reseau afin de produire des valeurs 
de sortie qui soient proches en reponse pour des valeurs d’entrees similaires. Ce type 
d’apprentissage possede souvent moins de complexity dans le calcul par rapport a l’apprentissage 
supervise. Bien entendu, l’architecture du reseau, prealablement definie par son utilisateur, est une 
forme de supervision (Hassoun 1995). 
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1.4. Les reseaux de neurones les plus utilises 

La Figure 1.4 represente les reseaux de neurones les plus utilises dans la litterature. Dans ce 
qui suit, nous allons faire une description de chacun d'eux. 

1.4.1. Le perceptron monocouche (perceptron simple) 

Le perceptron est le premier modele des reseaux de neurones invente en 1957 par Frank 
Rosenblatt (Rosenblatt 1958). C'est un reseau simple, puisqu’il ne se compose que d’une couche 
d'entree et d'une couche de sortie. II peut aussi etre utilise pour faire de la classification et pour 
resoudre des operations logiques simples, il suit generalement un apprentissage supervise (Talbi 
2011 ). 

1.4.2. Le perceptron multicouche (en anglais Multi Layer Perceptron) 

C'est une extension du precedent, avec une ou plusieurs couches cachees entre l’entree et la 
sortie (Keedwell et Narayanan 2005). Chaque neurone dans une couche est connecte a tous les 
neurones de la couche precedente et de la couche suivante. II peut resoudre des problemes non 
lineairement separables et des problemes logiques plus compliques (Talbi 2011). II suit un 
apprentissage supervise, ce reseau a ete choisi dans la suite de nos travaux. 

1.4.3. Les reseaux a fonction radiale 

Les reseaux a fonction de bases radiales (RFR) ou plus simplement reseaux a bases radiales 
ont ete proposes par Moody et Darken (Moody et Darken 1989). Les RFR seront done employes 
dans les memes types de problemes que les perceptrons multicouches a savoir, en classification et 
en approximation de fonctions, particulierement. L'apprentissage le plus utilise pour les RFR est le 
mode hybride (Talbi 2011). 

1.4.4. Les cartes auto-organisatrices de Kohonen (SOM) 

Les cartes topologiques ou cartes auto organisatrices ont ete introduites pour la premiere fois 
par Kohonen en 1982 (Kohonen 1982). Ce sont des reseaux a apprentissage non-supervise qui 
etablissent une carte discrete, ordonnee topo-logiquement, en fonction de patterns d'entree. Le 
reseau forme ainsi une sorte de treillis dont chaque noeud est un neurone associe a un vecteur de 
poids. La correspondance entre chaque vecteur de poids est calculee pour chaque entree. Par la 
suite, le vecteur de poids ayant la meilleure correlation, ainsi que certains de ses voisins, vont etre 
modifies afin d’augmenter encore cette correlation (Talbi 201 1). 
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1.4.5. Les reseaux de Hopfield 

Les reseaux de Hopfield (Hopfield 1982) sont des reseaux recurrents et entierement 
connectes. Dans ce type de reseau, chaque neurone est connecte a chaque autre neurone et il n'y a 
aucune difference entre les neurones d'entree et de sortie. Ils fonctionnent comme une memoire 
associative non-lineaire et sont capables de trouver un objet stocke en fonction de representations 
partielles ou bruitees. L'application principale des reseaux de Hopfield est l'entrepot de 
connaissances, mais aussi la resolution de problemes d'optimisation. Le mode d'apprentissage 
utilise ici est le mode non-supervise (Talbi 2011). 

1.4.6. Les reseaux ART 

Les reseaux ART (en anglais Adaptive Resonance Theory) sont des reseaux a apprentissage 
par competition (Carpenter et Grossberg 1987; Carpenter et Grossberg 1988). Dans ce genre de 
reseau, les vecteurs de poids ne seront adaptes que si l'entree fournie est suffisamment proche d'un 
prototype deja connu par le reseau. II est a noter qu'il existe deux principaux types de reseaux ART : 
les ART-1 pour des entrees binaires et les ART-2 pour des entrees continues. Le mode 
d'apprentissage des ART peut etre supervise ou non (Talbi 2011). 

1.5. Conception d’un modele neuronal 

Les reseaux de neurones realisent des fonctions non lineaires parametrees. Leurs mises en 
oeuvre necessitent : 

• La determination des entrees et des sorties pertinentes, c’est-a-dire les grandeurs qui ont une 
influence significative sur le phenomene que Ton cherche a modeliser ; 

• La construction de la base de donnees et le choix des echantillons ; 

• La determination du nombre de neurones caches necessaires pour obtenir une approximation 
satisfaisante ; 

• La realisation de V apprentissage ; 

• L’evaluation des performances du reseau de neurones a Tissue de T apprentissage. 


These L . Khaouane 


Page 14 


Chapitre I. Les reseaux de neurones 


1.5.1. Determination des entrees/sorties du reseau de neurones 

Pour toute conception de modele, la selection des entrees doit prendre en compte deux 
points essentiels (Ammar 2007) : 

• Premierement, la dimension intrinseque du vecteur des entrees doit etre aussi petite que 
possible, en d’autres termes, la representation des entrees doit etre la plus compacte 
possible, tout en conservant pour l’essentiel la meme quantite d’information et en gardant a 
P esprit que les differentes entrees doivent etre independantes. 

• En second lieu, toutes les informations presentees dans les entrees doivent etre pertinentes 
pour la grandeur que Eon cherche a modeliser : elles doivent done avoir une influence reelle 
sur la valeur de la sortie. 

1.5.2. Construction de la base de donnees et choix des echantillons 

Le processus d'elaboration d’un reseau de neurones commence par la construction d’une 
base de donnees et le choix des echantillons. II faut done determiner les grandeurs qui ont une 
influence significative sur le phenomene que l’on cherche a modeliser. 

Cette etape est cruciale et aide a determiner le type de reseau le plus approprie pour resoudre 
un probleme donne. En particulier, la fagon dont se presente fechantillon conditionne le type de 
reseau, le nombre de cellules d'entree et de sortie et la fagon dont il faudra mener fapprentissage, le 
test et la validation (Bishop 1995). 

Afin de developper une application a base de reseaux de neurones, il est necessaire de 
disposer de deux bases de donnees, une pour effectuer Fapprentissage et l’autre pour tester le reseau 
obtenu et determiner ses performances. 

Pour mieux controler la phase d’apprentissage, il est sou vent preferable de posseder une 
troisieme base de donnees appelee "base de validation croisee" (Stone 1977). Les avantages lies a 
l’utilisation de cette troisieme base de donnees seront exposes dans les paragraphes suivants. 
Notons qu’il n’y pas de regie pour determiner ce partage d’une maniere quantitative, neanmoins 
chaque base doit satisfaire aux contraintes de representativite de chaque classe de donnees et doit 
generalement refleter la distribution reelle, c’est-a-dire la probability d’occurrence des diverses 
classes (Nascimento et al. 2000). 
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Generalement, les bases de donnees subissent un pretraitement qui consiste a effectuer une 
normalisation appropriee tenant compte de 1’ amplitude des valeurs acceptees par le reseau. Les 
valeurs d’ entrees et de sortie sont normalisees dans un intervalle specifique afin de donner a chaque 
parametre la meme influence statistique. De plus, un probleme additionnel peut survenir a cause 
d’une possible saturation de la sortie, si la somme ponderee des entrees du perceptron multicouches 
(^(w/.xj ) est dans la partie asymptotique de la fonction d’activation (Dames 2005). 

1.5.3. Definition de la structure du reseau 

La determination de l’architecture optimale est restee pendant longtemps un probleme 
ouvert. II existe actuellement diverses methodes empiriques mettant notamment en jeu des tests 
statistiques pour une vaste classe de reseaux (Urbani et al. 1994). 

Comme nous l’avons mentionne, nous avons retenu le perceptron multicouche comme base 
du modele. Nous structurons ce reseau en precisant le nombre de couches et de neurones caches 
pour que le reseau soit en mesure de reproduire ce qui est deterministe dans les donnees. 

1.5. 3.1. Nombre de couches cachees 

Mis a part les couches d'entree et de sortie, il faut decider du nombre de couches 
intermediaries ou cachees. Sans couche cachee, le reseau n'offre que de faibles possibility 
d’adaptation. Neanmoins, il a ete demontre qu’un perceptron multicouches avec une seule couche 
cachee pourvue d’un nombre suffisant de neurones, peut appro ximer n’importe quelle fonction avec 
la precision souhaitee (Hornik 1991). 

1.5. 3. 2. Nombre de neurones caches 

Chaque neurone peut prendre en compte des profils specifiques de neurones d'entree. Un 
nombre plus important permet done de mieux "coller" aux donnees presentees, mais diminue la 
capacite de generalisation du reseau. Il faut alors trouver le nombre adequat de neurones caches 
necessaire pour obtenir une approximation satisfaisante. Le nombre de neurones caches depend du 
type de donnees dont on dispose. En general, ce nombre est determine par des regies empiriques. 
Suivant les auteurs, la taille de la couche cachee doit etre (Dames 2005) : 

• Soit egale a celle de la couche d'entree ; 

• Soit egale a 75 % de celle-ci ; 
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• Soit egale a la racine carree du produit du nombre de neurones dans la couche d'entree et de 
sortie. 

Pour des cas plus sophistiques, la recherche consisterait soit a : 

• Estimer un reseau comportant de nombreux neurones puis a le simplifier par Tanalyse des 
multi-colinearites ou par une regie d'apprentissage eliminant les neurones inutiles (Dames 
2005) ; 

• Definir une architecture tenant compte de la structure des variables identifiees au prealable 
par une analyse en composantes principals (Bermejo et Cabestany 1999; Bermejo et 
Cab estany 2001) ; 

• Augmenter progressivement la complexity du modele a chaque iteration, dite "Cascading”, 
et reevaluer l’efficacite de generalisation a chaque addition d’un nouveau neurone (Dames 
2005). 

1.5.4. Apprentissage 

Une fois farchitecture choisie, elle doit subir une phase d’apprentissage. Cette derniere 
consiste a calculer les coefficients synaptiques de telle maniere que les sorties du reseau de 
neurones soient, pour les exemples utilises lors de V apprentissage, aussi proches que possibles des 
sorties "desirees". Celles-ci correspondent a la valeur de la fonction que Eon veut approcher ou a la 
sortie du processus que Ton veut modeliser (Dreyfus 2008). 

L’apprentissage correspond done a la phase du developpement du reseau durant laquelle les 
coefficients synaptiques sont modifies jusqu'a fobtention du comportement desire. 

Dans notre etude, comme nous disposons des valeurs de sortie, nous avons choisi 
1’ apprentissage supervise, mettant en jeu un algorithme d’optimisation. Ce dernier cherche a 
minimiser, par des methodes d’optimisation non lineaire, une fonction de cout qui constitue une 
mesure de l’ecart entre les reponses reelles du reseau et ses reponses desirees (Dreyfus 2008). 

Cette optimisation se fait de maniere iterative, en modifiant les poids en fonction du gradient 
de la fonction de cout : le gradient est estime par une methode specifique, dite la regie du gradient 
de l’erreur (en anglais delta rule). C’est une des regies les plus utilisees pour 1’ apprentissage 
supervise de reseaux de neurones. Initialement developpee pour resoudre des problemes de 
traitements adaptatifs du signal, elle a conduit ensuite a un algorithme connu sous le nom de 
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l’algorithme de retro-propagation du gradient de l’erreur (en anglais Back-propagation) (Dames 
2005). On distingue deux etapes dans la phase d’apprentissage (Dames 2005) : 

• Une phase de propagation, qui consiste a presenter une configuration d’ entree au reseau, 
puis a la propager a celle de sortie en passant par les couches cachees. 

• Une phase de retro -propagation, qui consiste, apres le processus de propagation, a minimiser 
l’erreur commise sur l’ensemble des exemples presentes, erreur consideree comme une 
fonction des poids synaptiques. Cette erreur represente la somme des differences au carre 
entre les reponses calculees et celles desirees pour tous les exemples contenus dans 
l’ensemble de l’apprentissage. 

Les algorithmes de retro-propagation implantes actuellement dans les logiciels de RNA 
appartiennent a une des cinq classes suivantes (Si-Moussa 2009): 

• Descente du gradient ; 

• Descente des gradients conjugues ; 

• Quasi-Newton ; 

• Levenberg-Marquardt ; 

• Regularisation 


Le tableau 1.2 resume les algorithmes d’apprentissage par retro -propagation implante dans la 
boite a outils des RN du programme MATLAB ~ (Demuth et Beale 2000). 
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Tableau 1.2. Resume des caracteristiques des algorithmes d’apprentissage de retro-propagation 

implantes dans MATLAB® (Demuth et Beale 2000). 


Algorithme 

Caracteristiques 




Descente du gradient 


Descente du gradient simple ( traingd ) 

Descente du gradient de base. Reponse lente; peut 
etre utilisee pour apprentissage en mode sequentiel 

Descente du gradient avec moment 
( traingdm ) 

Descente du gradient avec moment. Le moment 
permet a un reseau de repondre non seulement au 
gradient local, mais aussi aux tendances recentes 
dans la surface d'erreur. Sans moment un reseau 
peut etre coince dans un minimum local peu 
profond. Plus rapide que traingd , ne peut etre 
utilisee que pour apprentissage en mode sequentiel 

Descente du gradient avec taux 
d’apprentissage variable ( traingda ) 

Taux d’apprentissage variable. Plus rapide que 
traingd , mais ne peut etre utilisee que pour 
apprentissage en mode batch. Utilise des regies 
heuristiques pour la variation du taux 
d’apprentissage 

Descente du gradient avec moment et taux 
d’apprentissage variable ( traingdx ) 

Descente du gradient avec inertie (momentum) et 
taux d’apprentissage variable 


Descente des gradients conjugues 


Descente des gradients conjugues avec la 
methode de mise a jour de Fletcher-Reeves 
(traincgf) 

11 possede la plus petite memoire de stockage 
parmi les algorithmes de gradient conjugues. 

Descente des gradients conjugues avec la 
methode de mise a jour de Polak-Ribiere 
(traincgp) 

Necessite une memoire de stockage legerement 
plus grande que traincgf. Convergence plus rapide 
sur quelques problemes. 

Descente des gradients conjugues avec la 
methode de reprises Powell-Beale (traincgb) 

Necessite une memoire de stockage legerement 
plus grande que traincgp. Convergence 
Generalement plus rapide. 

Scaled conjugate gradient (trainscg) 

Le seul algorithme de gradients conjugues qui 
n’exige aucune recherche de ligne. Tres bon 
algorithme d’apprentissage en general. 


Quasi-Newton 


BFGS quasi-Newton (trainbfg) 

11 exige le stockage d’une approximation de la 
matrice Hessienne et necessite plus de calcul a 
chaque iteration que les algorithmes de gradients 
conjugues, mais possede habituellement une 
convergence plus rapide. 
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Secante a un pas (trainoss) 

Cet algorithme exige moins de stockage et calcul 
par epoque que falgorithme BEGS. On peut 
considerer cela un compromis entre des algorithmes 
de quasi-Newton complets et des algorithmes de 
gradients conjugues. 

Levenberg-Marquardt 

Levenberg-Marquardt (trainlm) 

C'est falgorithme d’apprentissage le plus rapide 
pour les reseaux de taille moderee. 11 a la 
caracteristique de reduction de memoire pour 
futilisation quand l’echantillon d’apprentissage est 
grand. 

Regularisation 

Regularisation Bayesienne (trainbr) 

Mise a jour des poids et des biais selon 
foptimisation de Levenberg-Marquardt. 11 reduit au 
minimum une combinaison d'erreurs quadratiques 
et des poids et determine ensuite la combinaison 
correcte afin de produire un reseau avec une 
capacite de generalisation meilleure. Ce processus 
est appele la regularisation bayesienne. 11 reduit la 
difficult^ de determiner farchitecture de reseau 
optimum. 


1.5.5. Evaluation des performances du reseau de neurones 

Enfin, la derniere etape doit permettre d’estimer la qualite du reseau obtenu en lui presentant 
des exemples qui ne font pas partie de l’ensemble d’apprentissage. Elle permet a la fois d’apprecier 
les performances du systeme neuronal et de detecter le type de donnees qui posent probleme. Si les 
performances ne sont pas satisfaisantes, il faudra, soit modifie Earchitecture du reseau, soit modifie 
la base d’apprentissage (Dames 2005). 


1.6. Application des reseaux de neurones en bioprocedes 

Durant les dernieres annees, la litterature scientifique relative aux reseaux de neurones (RN) 
s’est enrichie considerablement par la publication des travaux relatant des applications diverses 
telles que la moderation, la reconnaissance des formes, foptimisation et le controle des 
bioprocedes, tous sujet d’interet en biotechnologie. Les ouvrages de Baughman et Liu (Baughman 
et Liu 1995), Montague et Morris (Montague et Morris 1994), Basheer et Hajmeer (Basheer et 
Hajmeer 2000) et Nicoletti (Nicoletti 2009) donnent des apergus sur les applications des RN en 
bioprocedes. Plusieurs applications sont resumees ci-dessous : 
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1.6.1. Moderation et prediction 

Plusieurs exemples, sur la moderation et la prediction par les RN, sont cites dans la 
litterature. A titre d’exemple, l’estimation en ligne des concentrations de la biomasse, du glucose et 
de 1’ ethanol par un reseau recurrent ayant pour entrees : les mesures anterieures, les conditions du 
processus et les entrees de commande du processus. Zhu et ces collaborateurs (Zhu et al 1996) ont 
utilise un RN pour decrire la production a grande echelle de lysine et ont predit avec succes la 
formation du produit a partir des mesures en ligne et la simulation recursive de la consommation du 
sucre. Galvan et ces co-auteurs (Galvan et al 1996) ont utilise les reseaux de neurones dans 
l’ajustement de donnees cinetiques complexes des reactions chimiques, ils ont demontre que cette 
modelisation s’avere tres utile lorsque les mecanismes cinetiques ne sont pas bien saisis et que 
suffisamment de donnees sur le processus sont disponibles. Les RN peuvent remplacer les modeles 
(semi-) mecanistiques, parce que, une fois ajuste, ils sont mathematiquement robuste, facile a 
utiliser et rapide (Fontaine et Germain 2001). 

Dans le travail de Shene et co-auteurs (Shene et al 1999), deux reseaux de neurones 
differents (un reseau neuronal de type feedforward et un reseau neuronal hybride) ont ete congus 
pour predire les variables d'etat dans la fermentation batch de V ethanol en tenant compte de l’effet 
de la composition du milieu et de la temperature. Becker et ces collaborateurs (Becker et al 2002) 
ont applique un RN dynamique pour la modelisation de la fermentation de la biere, suivie d’une 
optimisation des profils de temperature afin de reduire le temps de fermentation. Saraceno et co- 
autheurs (Saraceno et al 2009) ont simule la fermentation de lactoserum de frontage ricotta pour la 
production d'ethanol au moyen d’un modele neuronal hybride multiple, obtenu par couplage d’un 
reseau neuronal de type perceptron multicouches avec les equations de bilan de masse pour le 
lactose, 1' ethanol et la biomasse. Nasr et ces collaborateurs (Nasr et al 2013) ont developpes un 
modele neuronal de type retro -propagation pour estimer le profil de production d’hydrogene en 
fonction du temps dans les etudes batch, les entrees du RN sont : le pH initial, les concentrations 
initiates du substrat et de la biomasse, la temperature et le temps. Pour ce qui est de notre 
application (Khaouane et al 2013), modelisation de la fermentation fed-batch de la pleuromutiline, 
elle sera detaillee dans le 3 eme chapitre. 

1.6.2. Capteurs logiciels (en anglais soft sensors) 

Les RN sont aussi appliques pour le developpement de capteurs logiciels a des fins 
d’estimation et de controle. Generalement les mesures on line sont reliees aux mesures offline des 
etats du processus (Di Massimo et al 1992; Karim et al 1997; Ye et al 1998; Linko et al 1999). 
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Par exemple, les mesures on line tel que le pH , L ammoniac et la vitesse d’agitation ont ete 
appliques pour predire les niveaux de biomasse et de produit dans le travail de Jin et co-auteurs (Jin 
et al. 1996) et Linko et co-auteurs (Linko et al. 1997). Yuan et Vanrolleghem (Yuan et 
Vanrolleghem 1 999) ont applique les RN pour la prediction on line des pro fils de concentration de 
penicilline. 

En outre, les informations specifiques du processus comme la phase du processus et le temps 
de fermentation peuvent etre utilisees comme des inputs additionnels (Di Massimo et al. 1992). Les 
capteurs logiciels peuvent aussi etre appliques pour remplacer les procedures analytiques couteuses 
et difficiles. Kang et ces collaborateurs (Kang et al. 1998) ont developpe un capteur logiciel pour la 
mesure de la concentration de l’acide clavulanique. Une autre nouveaute est le nez electronique 
(Bachinger et Mandenius 2000). 

1.6.3. Reconnaissance des formes (en anglais pattern recognition) 

Les RN sont appliques pour la detection des irregularites du processus, pour reduire la 
variability du processus, pour la prediction on line de la performance du processus et pour detecter 
les defauts des capteurs (Glassey et al. 1997). Un autre exemple est l’application d’un RN a auto- 
organisation (Kohonen) pour etablir un rapport entre les donnees de la qualite des semences pour 
predire la performance de la phase finale de la fermentation (Ignova et al. 1999) ; Par ailleurs, la 
phase finale atypique de la fermentation peut etre detectee des le debut. L’application des RN auto- 
associative pour la detection d’anomalie on line a ete proposee par Shimizu et co-auteurs (Shimizu 
et al. 1998) et aussi appliquee dans la production de virginiamycin par Huang et ces collaborateurs 
(Huang et al. 2002). 

1.6.4. Optimisation 

Les RN ont ete appliques pour 1’ optimisation a base de modele des milieux de culture en 
mode batch par kennedy et co-auteurs (Kennedy et al. 1992; Kennedy et Spooner 1996), qui a 
abouti a une grande reduction dans les experiences par comparaison a l’approche classique basee 
sur les plans d’ experience. 

La combinaison des RN avec les algorithmes evolutionnaires, tel que les algorithmes 
genetiques, a donne naissance a une nouvelle approche qui a prouve et ne cesse de prouver son 
efficacite et sa robustesse dans 1’ optimisation des milieux de culture de Lactobacillus plantarum 
(Desai et al. 2006), optimisation des constituants du milieu pour la production de lipase (Haider et 
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al 2008), optimisation de la production de scleroglucane (Desai et al 2008), optimisation de la 
production de L-asparagine (Gurunathan et Sahadevan 2011) et optimisation de la production de 
lipase (Nelofer et al 2012). 

1.6.5. Controle 

Les RN sont souvent appliques au sein des schemas de controle en tant que modeles, 
estimateurs d’etat ou optimiseur. Schenker et Agarwal (Schenker et Agarwal 1998) ont etudie 
different type de structures neuronales pour le controle predictif des reacteurs chimiques. Kovarova 
et ces collaborateurs (Kovarova-Kovar et al 2000) ont utilise un modele neuronal en combinaison 
avec une optimisation on line pour l’adaptation de la trajectoire d’ alimentation durant la production 
de ribo flavine. 

1.7. Conclusion 

Ce chapitre introduit les notions de base sur les reseaux de neurones artificiels (RN). Apres 
un historique sur l’apparition des RN et la presentation du modele biologique et mathematique du 
neurone, les differentes architectures des RN ainsi que leurs types d’apprentissage sont presentes. 
Dans un deuxieme temps, nous avons expose les RN les plus utilises ainsi que les differentes etapes 
de conception d’un reseau de neurones. Nous avons termine ce chapitre par la presentation de 
different travaux relatant des applications diverses des RN en bioprocedes notamment dans la 
modelisation, la prediction, la reconnaissance des formes, foptimisation et le controle. 
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Chapitre II. Optimisation par essaim de particules 


II. 1. Introduction 

L’ optimisation des problemes dits "difficiles", qui surgissent dans des secteurs tres divers 
notamment en biotechnologie, a conduit les chercheurs a proposer des methodes de resolutions 
performantes et conceptuellement differentes des techniques classiques de programmation 
mathematique. Parmi ces methodes modernes d’ optimisation, on trouve les meta-heuristiques. 

Les meta-heuristiques sont souvent inspirees par les systemes naturels, qu’ils soient pris en 
physique (cas du recuit simule), en biologie de E evolution (cas des algorithmes genetiques) ou 
encore en ethologie (cas des algorithmes de colonies de fourmis ou l’optimisation par essaim de 
particules). L’avantage des meta-heuristiques est de trouver un minimum global a un probleme de 
minimisation et de ne pas rester bloque sur un minimum local (Dorigo et Caro 1999). 

Ce chapitre est consacre uniquement a E optimisation par essaim de particules OEP (en 
anglais Particle Swarm Optimization PSO), 1’algorithme d’OEP est Pun des algorithmes 
heuristiques modernes, qui peut etre utilise pour optimiser des problemes non-lineaires, non- 
continus et a plusieurs variables (Eberhart et Kennedy 1995). II est inspire des essaims d’insectes 
(abeilles, guepes,...), des ecoles de poissons, ou des troupeaux d’oiseaux et de leurs mouvements 
coordonnes. En effet, comme ces animaux se deplacent en groupe pour trouver la source de 
nourriture ou eviter les predateurs, Ealgorithme a essaim de particules recherche des solutions a un 
probleme d’ optimisation. 

Compare a d’autres algorithmes evolutionnaires comme les algorithmes genetiques, 
Ealgorithme d’OEP presente des proprietes interessantes telles que : mise en oeuvre facile, efficacite 
de calcul, de memoire et une cooperation constructive entre les individus, il est done plus probable 
et plus rapide d’affluer dans le domaine des meilleures solutions et de trouver rapidement des 
resultats optimaux (Eberhart et Kennedy 1995; Cockshott et Hartman 2001). 

Dans un premier temps, nous donnons un apergu sur les modeles historiques relatifs a 
l’OEP. Nous poursuivons en exposant Ealgorithme de base de l’OEP (description mathematique, 
etapes de Ealgorithme et les caracteristiques principales). Nous presentons aussi, d’une maniere 
generale, le confinement des particules, la topologie du voisinage ainsi que les differentes variantes 
de Ealgorithme. Nous terminons ce chapitre par la presentation des diverses applications reussites 
de Ealgorithme en biotechnologie. 
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II.2. Developpement historique 

L’ optimisation a essaim de particules est une meta-heuristique developpee en 1995 par 
Eberhart (ingenieur en electricite) et Kennedy (socio-psycho logue) (Eberhart et Kennedy 1995). Cet 
algorithme s’inspire de l’intelligence en essaim et s’appuie notamment sur un modele developpe par 
le biologiste Reynolds a la fin des annees 80, permettant de simuler le deplacement organise d’un 
groupe d’oiseaux (Reynolds 1987). 

11.2.1. Modele de Reynolds 

En 1987, Reynolds (Reynolds 1987) crea un modele appele "boid", afin de simuler les 
formations des oiseaux pour mieux comprendre et expliquer ces phenomenes et egalement la 
coordination des mouvements (parfois tres brusques) de ces populations. Un boid est une entite 
sensee modelisee un individu afin d’etudier les proprietes d’assemblage de plusieurs de ces 
individus. Chaque boid est implements individuellement et navigue selon sa propre perception de 
fenvironnement dynamique. Un boid obeit aux trois regies simples suivantes (Khedam 2008) : 

1. Regie de separation qui stipule qu’un boid doit s’eloigner des autres boids trop proches de lui ; 

2. Regie de mimetisme ou d’alignement qui stipule qu’un boid doit se deplacer dans la meme 
direction que l’ensemble en moyennant les vitesses et les directions des autres boids ; 

3. Regie de cohesion qui stipule qu’un boid doit eviter de se trouver sur l’exterieur de la 
formation et ainsi se deplacer vers le centre pergu de la formation. 

Ces trois regies de base, permettent l’attraction et la repulsion de chacun des individus et permettent 
la stabilite de l’ensemble (Khedam 2008). 

11.2.2. Modele de Kennedy et Eberhart 

Kennedy et Eberhart (Eberhart et Kennedy 1995) ont cherche a simuler la capacite des 
oiseaux a voler de fagon synchrone et leur aptitude a changer brusquement de direction tout en 
restant en une formation optimale. Le modele qu’ils ont propose a ensuite ete etendu en un 
algorithme simple et efficace d’optimisation. Les particules sont les individus et elles se deplacent 
dans l’hyperespace de recherche. Le processus de recherche est base sur les deux regies suivantes 
(Khedam 2008) : 

1. Chaque particule est dotee d’une memoire qui lui permet de memoriser le meilleur point par 
lequel elle est deja passee et elle a tendance a retourner vers ce point. 
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2. Chaque particule est informee du meilleur point connu au sein de son voisinage et elle va 
tendre a aller vers ce point. 

Dans ce modele, rintelligence est done collective et non individuelle. L'environnement et les 
interactions y jouent un role fondamental. Ainsi, dans un essaim volant ou nageant, chaque individu 
reagit aux differentes regies etablies par Reynolds, Kennedy et Eberhart. Ces regies sont identiques 

a toute la population et ne prennent en compte que le voisinage immediat de T individu qui ne peut 

> 

pas percevoir l’ensemble du nuage. A partir du deplacement local de l’individu, des formes 
complexes pour le nuage d’animaux vont pouvoir apparaitre, formes qui depassent le cadre de la 
regie locale. Cette propriete d’emergence est recherchee dans de nombreux problemes 
d’informatique, puisqu’elle va notamment permettre a la fois un parallelisme decentralise et 
massive de Ealgorithme, avec des comportements elementaires simples tout en obtenant 
globalement un resultat complexe (Khedam 2008). 

II.3. L’algorithme de base 

II.3.1. Description mathematique 

Un essaim de particules, qui sont des solutions potentielles au probleme d'optimisation, 
"survole" fespace de recherche, en quete de foptimum global. Le deplacement d'une particule est 
influence par les trois composantes suivantes (Cooren 2008) : 

i. Une composante physique : la particule tend a suivre sa direction courante de deplacement ; 

ii. Une composante cognitive : la particule tend a se diriger vers le meilleur site par lequel elle 
est deja passee ; 

iii. Une composante sociale : la particule tend a se tier a l'experience de ses congeneres et, ainsi, 
a se diriger vers le meilleur site deja atteint par ses voisins. 

Dans le cas d'un probleme d'optimisation, la qualite d'un site de fespace de recherche est 
determinee par la valeur de la fonction objet en ce point. La figure II. 1 illustre la strategie de 
deplacement d'une particule. 

Dans la version originale de l’OEP, 1’ essaim se compose de N particules en mouvement 
autour d’un espace de recherche D-dimensionnelle de la fonction objet (en anglais fitness or 
objective function). Chaque particule evalue la fonction objet a son emplacement actuel, puis 
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determine son mouvement a travers l’espace de recherche en comb inant certains aspects de 
l’histoire de ces emplacements actuels et meilleurs avec ceux d’un ou de plusieurs membre de 
P essaim, avec quelques perturbations aleatoires. 


La valeur Pbesti est presentee comme le meilleur emplacement deja visite de la i eme 
particule, elle est notee Pi= (Pa, Pi 2 ,...,Pid)- La valeur gbest est le meilleur emplacement globale 
dans les emplacements visites de toutes les particules jusqu'a present, elle est notee g= (gj, g 2 ,---, 
gd). La position instantanee de la i eme particule est presentee par x t = (xu, xq, Xui), x^[x min , x max \ et 
sa vitesse est presentee par v,-= (vu, v i2 , ..., vm), v^[v min , v ma x\- 


v max est une vitesse maximale seuil qui est une constante predeterminee selon la fonction 
d’ optimisation objectif. Si une vitesse dans une dimension depasse le maximum, elle sera reglee a 
v max . ce parametre controle la vitesse de convergence de l’algorithme d’OEP et peut l’empecher de 
se developper trop vite (Panigrahi et al. 2011). 

A chaque iteration, la position et la vitesse de la f me particule sont mis a jour avec Pbesti et 
gbest de Pessaim de population. Les equations de mise a jour peuvent etre formulees ainsi : 

v id (/ + !) = wv id (t) + c,7- (Pbest ul {() - x id (/)) + c 2 r 2 (, gbest d (/) - x id (()) (II.l ) 


x id (* + 1 ) - x id (0 + v id (* + 0 


(H.2) 


Ou ri et r 2 sont deux nombres aleatoires avec une repartition uniforme entre 0 et 1 ; ci et C 2 sont 
deux constantes, appelees coefficients ^acceleration ; w est en general une constante repartie 
uniformement dans Pintervalle [0, 1], appelee facteur d’inertie ou coefficient d’inertie ou encore 
poids d’inertie (Panigrahi et al. 201 1). 

• wvid(t) correspond a la composante physique du deplacement. Le parametre w controle 
finfluence de la direction de deplacement sur le deplacement fiitur. II est a noter que, dans 
certaines applications, le parametre wpeut etre variable (Cooren 2008). 

• cjrj(Pbestid(t)-Xid(t)) correspond a la composante cognitive du deplacement, cj controle le 
comportement cognitif de la particule. 

• C 2 r 2 (gbestd(t)-Xid(t)) correspond a la composante sociale du deplacement. C 2 controle faptitude 
sociale de la particule. 
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La combinaison des parametres w, ci et C 2 permet d’etablir un equilibre entre les phases 
diversification et intensification du processus de recherche (Porto et al 1998; Eberhart et al. 2001). 


Vers ma 
meilleure 
performance 


Position 


Vers la meilleure 
performance de mes 
informatrices 


actuelle 

V* 


vitesse 

acmelle 
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Figure II.1. Schema du principe de deplacement d’une particule (Slimani 2009). 

II.3.2. Les etapes de Palgorithme 

L’algorithme de cette methode peut etre decrit comme suit (Slimani 2009) : 

• l ere etape : Initialisation des coefficients cy, c 2 et w. 

• 2 eme etape : Creation de la population initiale aleatoirement et calcul de la fitness de chaque 
particule ( Pbesti ) : la meilleure position de la particule i dans la population actuelle ; ( gbest)\ 
la meilleure position dans toutes les populations (la meilleure des meilleures). 

• 3 eme etape : Calcul de la nouvelle vitesse et nouvelle position de chaque particule par 
P utilisation des formules (II. 1) et (II.2). 

• 4 eme etape : Calcul de la meilleure fitness de la population initiale et comparer a la 
precedente pour trouver la meilleure de toutes les populations ( gbest ). 

A 

• 5 eme etape : Incrementassions du nombre d’iteration t = t+1. 

• 6 eme etape : Passer a la 7 eme etape si un critere d’arret est satisfait. Autrement, aller a la 3 


eme 


etape. 


reme r 


etape : La position enregistree dans (gbest) est la solution optimale. 


La figure II. 2 presente forganigramme de la methode d’OEP. 


Le critere d'arret peut etre different suivant le probleme pose. Si foptimum global est connu 
a priori, on peut definir une "erreur acceptable” comme critere d’arret. Sinon, il est commun de fixer 
un nombre maximum devaluations de la fonction objet ou un nombre maximum d’iterations comme 
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critere d'arret. Cependant, au regard du probleme pose et des exigences de l'utilisateur, d'autres 
criteres d'arret peuvent etre utilises (Cooren 2008). 



Figure II.2. Organigramme de la methode d’OEP (Slimani 2009). 


II.3.3. Caracteristiques principales 

Ce modele presente quelques proprietes interessantes, qui en font un bon outil pour de 
nombreux problemes d’ optimisation, particulierement les problemes fortement non lineaires, 
continus ou mixtes (certaines variables etant reelles et d’autres entieres) (Slimani 2009) : 

• il est facile a programmer, quelques lignes de code suffisent dans n’importe quel langage 
evolue. 

• il est robuste (de mauvais choix de parametres degradent les performances, mais 
n’empechent pas d’obtenir une solution). 
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Pour realiser son prochain mouvement, chaque particule combine trois tendances : suivre sa 
vitesse propre, revenir vers sa meilleure performance, aller vers la meilleure performance de ses 
informatrices. 

II.4. Confinement des particules 

II est possible que le deplacement d'une particule la conduise a sortir de fespace de 
recherche. Dans ce cas, onpeut assister a une amplification des retroactions positives, qui conduit a 
une divergence de systeme. Pour s'affranchir de ce probleme, on peut introduire un nouveau 
parametre v max , qui va permettre de controler fexplosion du systeme (Eberhart et al 1996). Une 
etude sur le comportement de TOEP suivant les valeurs de v max est disponible dans (Fan et Shi 
2001 ). 


De plus, une strategic de confinement des particules peut etre introduite. Une telle strategie 
permet de ramener une particule sortie de fespace de recherche a finterieur de celui-ci. Plusieurs 
methodes peuvent etre alors employees (Cooren 2008) : 

• La particule est laissee a fexterieur de fespace de recherche, mais on n'evalue pas sa 
fonction objet. Ainsi, elle ne pourra pas attirer les autres particules en dehors de fespace 
de recherche ; 

• La particule est stoppee a la frontiere et les composantes correspondantes de la vitesse 
sont annulees ; 

• La particule rebondit sur la frontiere. La particule est stoppee sur la frontiere, mais les 
composantes correspondantes de la vitesse sont multipliees par un coefficient a tirer 
aleatoirement dans fintervalle [-1,0]. 

Cependant, suivant les besoins, de nombreuses autres methodes peuvent etre utilisees. 

II.5. Topologie du voisinage 

Le voisinage constitue la structure du reseau social. Les particules a finterieur d’un 
voisinage communiquent entre elles. Differents voisinages ont ete etudies (Kennedy 1999) et sont 
consideres en fonction des identificateurs des particules et non des informations topologiques 
comme les distances euclidiennes dans fespace de recherche (Kennedy 1999; Wang et al 2005) : 
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• Topologie en etoile (Figure II. 3 (a)) : le reseau social est complet, chaque particule est 
attiree vers la meilleure particule notee gbest et communique avec les autres. 

• Topologie en anneau (Figure II.3 (b)) : chaque particule communique avec n voisines 
immediates ( n = 3). Chaque particule tend a se deplacer vers la meilleure dans son 
voisinage local note Pbest. 

• Topologie en rayon (Figure II. 3 (c)) : une particule "centrale" est connectee a toutes les 
autres, seule cette particule centrale ajuste sa position vers la meilleure. Si cela provoque 
une amelioration, l’information est propagee aux autres. 




(a) Etoile 


(b) Anneau 


particule centrale 



(c) Rayon 


Figure II.3. Trois topologies du voisinage (Slimani 2009). 


II.6. Facteur d’inertie et variantes de Falgorithme d’OEP 

Le facteur d’inertie joue un role important dans le comportement de convergence de 
Falgorithme d’OEP. Le facteur d’inertie est utilise pour controler Fimpact de Fhistorique des 
vitesses precedentes sur la vitesse instantanee (Pinter 2006). De cette fagon, le parametre w regule 
le compromis entre les aptitudes d’exploration (recherche globale) et d’ exploitation (recherche 
locale). Une grande valeur du poids d’inertie facilite la recherche globale (recherche de nouveaux 
domaines), tandis qu’une valeur faible tend a faciliter la recherche locale (affiner la zone de 
recherche en cours) (Pinter 2006). 

Une valeur appropriee du facteur d’inertie foumit habituellement un equilibre entre les 
capacites de recherche globales et locales et par consequent une reduction du nombre d’iterations 
necessaire pour trouver la solution optimale (Pinter 2006). 

Une regie generate suggere qu’il est preferable initialement de definir une grande valeur du 
coefficient d’inertie, afin de favoriser l’exploration dans l’espace de recherche et progressivement la 
diminuer afin d’augmenter la performance de Falgorithme d’OEP (Pinter 2006). 
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Plusieurs chercheurs ont essaye d’etablir cet equilibre entre P exploitation et P exploration, ce 
qui a genere et ne cesse de generer des variantes de l’algorithme d’OEP. On se limite dans ce qui 
suit a quatre variantes. 

II.6.1. Trelea de types 1 et 2 (reglage fixe) 

Dans Particle de Trelea (Trelea 2003) et apres un grand nombre d’experiences de 
simulation, il a ete demontre qu’une bonne convergence peut etre assuree par deux series de 
parametres (serie 1 :w = 0.6, cj = C 2 = 1.7 ; serie 2 :w = 0.729, cj = C 2 = 1.494). 


v id (/ + ]) = 0.6v id (?) + !. 7 / * {Pbest ul (t ) - x id (/)) + 1 .7r 2 (gbest d (t) - x id (/)) 


(H.3) 


v id {t + 1) = 0.729v, id (t)+ 1 .494/; {Pbest id (t)~ x id (?))+! ,494r 2 {gbest d {t)-x id ( t )) 


(H.4) 


II.6.2. Approche du poids d’inertie 

Cette approche est basee sur la diminution du poids d’inertie selon l’equation suivante 
(Eberhart et al. 2001) : 


w = w — 

max 


(w —w ) 

\ max mm / 


Iter 


Iter 


(H*5) 


max 


Avec : w max , w min : poids d’inertie initiale et finale ; 


Iter m ax : nombre d’ iteration maximal ; 


Iter : nombre d’iteration actuel. 


II.6.3. Approche du facteur de constriction 

Clerc et Kennedy (Clerc et Kennedy 2002) ont developpe un facteur de constriction ayant 
pour but d’assurer la convergence de l’algorithme d’OEP. Ce facteur x est introduit dans la formule 
de calcul de vitesse et est definie comme suit : 


v ul {t + \) = x® [v id (0 + c,/; {Pbest ul (/) - x id (t)) + c 2 r 2 (, gbest d (/) - x id (0)] 


r 



v. 


21 

2 -<j)-yj<j) 2 -4(j) 
k 


Si<f>y 4 
Si 0<</><4 


(H.6) 


(H*7) 
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Avec : (j) = ci+C 2 \ 

k est un nombre entre 0 et 1, qui est general ement pris egale a 1 . 

II.7. Application de Falgorithme cFOEP en bioprocedes 

II.7.1. Estimation de parametres 

L’estimation des parametres d’un modele (nomme aussi calibration de modele) constitue 
une phase importante dans le processus de construction d’un modele mathematique (Figure II.4). La 
qualite des parametres estimes et par consequent la methode d’ estimation utilisee a cette fin ont une 
grande influence sur les performances du modele (efficacite de prediction et utilite futur). 
L’algorithme d’OEP et vue ces qualites citees precedemment s’est ajoute ces dernieres annees aux 
methodes d’ estimation existantes dans la litterature comme un estimateur precis. En effet, 
Falgorithme d’OEP a demontre une tres grande efficacite dans la calibration des modeles 
mathematiques decrivant : 

• les procedes d’ adsorption pour la separation de 1’ enzyme dans une colonne a lit expanse 
(Moraes et al. 2009) ; 

• la bio-sorption des colorants synthetiques a partir de l’eau (Fiorentin et al 2010) ; 

• separation des sucres a partir du melange reactionnel pour la production de fructo- 
oligosaccharides en utilisant la zeolite X comme adsorbant dans un reacteur a cuve agitee 
(Kuhn 2010) ; 

• le processus batch de biodegradation des composes toxiques BTEX (Benzene, Toluene, 
Ethyle benzene et les isomeres de Xylene) (Trigueros et al 2010) ; 

• l’adsorption de cephalosporine C dans une colonne a lit fixe (Burkert et al 2011). 
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Figure II.4. Phases du processus de modelisation en biotechno logie. 

II.7.2. Apprentissage des reseaux de neurones de type perceptron multicouches 

L’apprentissage des reseaux de neurones, comme onavu dans le l ei chapitre, constitue une 
phase cruciale dans le developpement d’un modele neuronal durant laquelle on calcul les poids des 
neurones de telle maniere que les sorties du reseau soient aussi proches que possibles des sorties 
desirees. Lors des revues de l’application des RN en biotechnologie au fil des annees, 90 % des 
recherches utilisaient l’algorithme de retro-propagation du gradient dans V apprentissage des RN 
multicouches. Bien que cet algorithme s’est avere efficace dans certaines applications, il presente 
cependant deux inconvenient majeurs (Haridas et Devi.M 2010) : 

i. Taux de convergence est relativement lent ; 

ii. Risque d’etre bloque ou pieges dans un minimum local. 

Pour surmonter le probleme de taux de convergence lent, les chercheurs ont propose 
plusieurs solutions, la plus recente d’entre elles et qui a prouve son efficacite (bonne precision et 
bonne capacite de generalisation) consiste a coupler le RN avec Palgorithme d’OEP (RNOEP) 
(Haridas et Devi.M 2010). 

Cette approche fructueuse (RNOEP) trouve de denombrables applications dans divers 
domaines, cependant en biotechnologie on en a trouve jusqu’ a present que deux applications : 
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• Shee et ces collaborateurs (Shee et al 2011) ont developpe un classificateur efficace a 
l’aide d’un RN multicouches pour la classification des sequences de proteines. Pour cela 
ils ont combine Palgorithme d’OEP et l’algorithme de retro-propagation, donnant 
naissance ainsi a une methode hybride d’apprentissage des RN qui a donne de bons 
meilleurs resultats par comparaison a Palgorithme de retro -propagation et done un 
classificateur efficace. 

• Pour ce qui de notre application Khaouane et ces collaborateurs (Khaouane et al 2012a) 
elle sera detaillee dans le 4 eme chapitre. 

II.7.3. Optimisation des modeles neuronaux 

L’algorithme d’OEP est utilise pour rechercher fespace d’entree optimal d’un modele 
neuronal et trouver ainsi la sortie correspondante optimale du modele. Huang et ces collaborateurs 
ont couple un modele neuronal avec l’algorithme d’OEP pour optimiser la production de l’acide 
gamma-amino-butyrique (Huang et al 2007). Liu et co-auteurs ont applique un RN a fonction 
radiale avec une variante de l’algorithme d’OEP pour optimiser les conditions de culture de 
Streptococcus zooepidemicus et ceux afin de maximiser la production d’acide hyaluronique (Liu et 
al 2009). 

II.8. Conclusion 

Dans ce chapitre, nous avons donne des notions de base necessaire dans la suite de nos 
travaux sur l’algorithme d’OEP. Apres un bref historique sur l’origine de l’algorithme, nous avons 
presente sa description mathematique, ces etapes de conception et ces caracteristiques principales. 

Dans un deuxieme temps, nous avons expose d’une fagon generate le confinement des particules, la 
topologie du voisinage, ainsi que quelques variantes de Palgorithme. Nous avons termine ce 
chapitre par les differentes applications de l’algorithme d’OEP en bioprocedes notamment pour 
l’estimation des parametres physiques de modeles mathematiques, l’apprentissage des RN et 
1’ optimisation des modeles neuronaux. 
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Chapitre III . Modelisation de la fermentation fed-batch de pleuromutiline par les reseaux de neurones 


III.l. Introduction 

Les reseaux de neurones artificiels (RN) ont acquis une grande popularity dans la derniere 
decennie en raison de leur parallelisme eleve, robustesse (Basheer et Hajmeer 2000) et, plus 
interessant encore, leur capacity inherente a extraire a partir des donnees experimentales, les 
relations fortement non-lineaires et complexes entre les variables du probleme (Si-Moussa et al. 
2008) sans aucune connaissance detaillee du systeme (Bryjak et al. 2004). 

Dans ce chapitre, nous avons developpe trois modeles neuronaux de type feedforward, afin 
d’evaluer les quantites difficilement mesurables on line, a savoir les concentrations de la biomasse, 
du substrat et du produit, a partir de variables facilement mesurables dans la fermentation fed-batch 
de pleuromutiline. Ces modeles neuronaux peuvent trouver des applications tres interessantes dans 
le controle numerique du processus en question et done permettront 1’ amelioration de la 
reproductibilite du processus et 1’ augmentation de la productivity. Les resultats de la modelisation 
neuronale de cette biosynthese de pleuromutiline ont ete publics dans le ’’Brazilian Journal of 
Chemical Engineering” (Khaouane et al 2013). 

Le chapitre est organise en deux parties : 

• Dans la premiere partie nous presentons les materiels et methodes utilises : Nous examinons 
d’abord la base de donnees collectees. Ensuite, nous presentons la procedure de 
developpement et d’optimisation de l’architecture des trois modeles neuronaux de type 
feedforward employes respectivement pour decrire la croissance microbienne, la 
consommation du substrat et la formation du produit. Par la suite, une comparaison des trois 
modeles neuronaux optimises avec les modeles cinetiques est realisee afin de mieux illustrer 
la methode. Enfin, une analyse de sensibilite, par deux methodes differentes, est appliquee 
aux trois RN optimises. 

• Dans la deuxieme partie, les differents resultats prometteurs obtenus sont discutes : Dans un 
premier temps, nous presentons les architectures optimales des modeles neuronaux ainsi que 
leurs performances de prediction. Ensuite, apres V extraction de formules mathematiques a 
partir de ces modeles et la presentation des resultats de comparaison, nous etudions leurs 
performances d’ interpolation. Cette partie ce termine par les resultats de l’analyse de 
sensibilite. 
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III.2. Materiels et methodes 

111.2.1. Collecte des donnees, pretraitement et analyse 

Dix-neuf ensembles de donnees (lots) ont ete foumis par Antibiotical, une filiale du groupe 
pharmaceutique algerien Saidal, contenant des donnees sur : la concentration en biomasse (A), la 
consommation de glucose (5), la concentration en pleuromutiline (P), revolution du pH et l'indice 
de refraction du bouillon de fermentation ( IR ). 

Les donnees experimentales rassemblees ont ete interpolees en utilisant une 
fonction MATLAB "spline cubique" quand necessaire et lissees avec un flltre numerique a 
moyenne mobile (en anglais "Digital Moving Average Filter"). Sans lissage, le RN a tendance a 
capturer le bruit dans le systeme plutot que les mecanismes fondamentaux du processus sous-jacent 
(Laursen et al 2007), ce qui entraine une efficacite inferieure et un temps plus long dans 
l’apprentissage du RN. 

111.2.2. Procedure de developpement des modeles 
III. 2. 2.1. Description des modeles 

Un reseau de neurones tel que decrit dans le premier chapitre est un cadre de calcul qui est 
inspire par les systemes neuronaux biologiques. II se compose d'un certain nombre d'unites de 
traitement simple interconnects appeles neurones artificiels. L'un des paradigmes les plus 
populaires des reseaux de neurones appliques a la modelisation d'un large eventail de systemes non 
lineaires, en particulier des processus d'ingenierie chimique et biologique, est le reseau de neurones 
de type feedforward (RNFF) a algorithme de retro -propagation du gradient (Lee et Park 1999; Silva 
et al. 2000), qui est utilise dans le present chapitre avec un apprentissage supervise et pour un 
horizon de prevision. 

Trois modeles de RNFF caracterises par la meme structure generale (une couche d'entree, 
une ou deux couches cachees et une couche de sortie) ont ete congus pour predire respectivement 
les profils de concentration de la biomasse (RNA), du glucose (RMS) et du produit (RNP) au cours 
de la fermentation fed-batch de la pleuromutiline. Le choix de trois RN au lieu d’un seul regroupant 
les trois sorties simultanement se justifie par l’intensite de la liaison qui existe entre ces parametres. 
Cette intensite de liaison a ete obtenue par le calcul des coefficients de correlation de Pearson ( R ) : 
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R{z, y ) = 



(iii*i) 


Ou Zf est la i eme valeur du vecteur Z (X, S ou P) ; yi est la i eme valeur du vecteur Y (X, S ou P) ; z et y 
sont respectivement les moyennes arithmetiques des vecteurs Z et Y. 

Le tableau III. 1 regroupe les coefficients de correlation entre X, S et P. On remarque que, le 
degre de correlation est eleve entre X et S et entre S et P (± 0.75 < R < ±1), tandis qu’ entre X et P 
le degre de correlation est modere (± 0.25 < R < ± 0.75) j montrant ainsi 1’ existence de liaison 
lineaire entre X et S , entre S et P et entre X et P. 


Tableau III.l. Matrice de correlations entres les outputs ( X , S et P). 



X 


P 

X 

1 

-0.9 

0.73 

s 

-0.9 

1 

-0.75 

p 

0.73 

-0.75 

1 


Les entres des trois modeles sont : le temps de fermentation ( t ), le pH , l’indice de refraction 
(JR), la concentration initiale d'inoculum (X 0 ) et la concentration initiale en glucose (So). Une 
analyse preliminaire fondee sur la methode "stepwise” utilisee pour tester les contributions des 
entrees du RN a revele que ces variables presentaient la plus forte influence sur la performance des 
processus ; plus de detail sur cette technique peut etre trouve dans (Gevrey et al. 2003). Les sorties 
sont la biomasse pour le premier modele (RN20, la consommation du substrat pour le deuxieme 
modele (RMS) et le produit pour le troisieme modele (RMP). L'analyse statistique des donnees 

d'entree et de sortie, en termes de la moyenne arithmetique x (Equation III.2), de la deviation 
standard (Equation III.3), du minimum et du maximum, est indiquee dans le tableau III.2. 



(III.2) 



(III.3) 
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Tableau III.2. Analyse statistique des donnees d'entree et de sortie. 


Variables 

Moyenne 

DS 

Min 

Max 

*00 

140 

83,7 

0 

280 

pH 

7 

0,3 

5,69 

7,67 

IR 

2,9 

0,9 

1,80 

6,67 

X 0 (%) 

4 

1,7 

1 

7 

So (g/1) 

24,8 

2,8 

19,69 

30,36 

X (%) 

45,1 

15,7 

1 

63,17 

S (g/1) 

15,1 

4,3 

9,30 

30,36 

P (mg/g) 

1,7 

1,3 

0 

7,25 


III.2.2.2 . Developpement des modeles 

Dans ce chapitre, une procedure basee sur le developpement et foptimisation de 
rarchitecture d'un RNFF est avancee. Elle est basee, comme decrit sur la figure III. 1 , sur la 
conception de quatre sous-modeles de RNFF qui se distinguent par le type de fonction de transfert 
et le type d’algorithme d'apprentissage couramment utilise en biotechnologie. 

Afin de rendre l’apprentissage des quatre sous-modeles plus efficace en empechant la 
fonction de transfert de devenir sature et rendre l’apprentissage des reseaux tres rapide, les entrees 
et les sorties ont ete normalisees dans l’intervalle (IN) 0 a 1 et-lal suivant la fonction de transfert 
attribute a la couche cachee (FTCC) (log-sigmoide ou tangente hyperbolique sigmoide, 
respectivement), en utilisant fequation de normalisation suivante : 



(y max Emin) 


( x—x • ^ 

min 


V X —x • / 

V max mm J 


+y 


mm 


(III-4) 


Ou xn est la valeur normalisee du parametre x (t, pH, IR, X 0 , So, X, S ou P) ; x max et x min sont 
respectivement les valeurs maximales et minimales de x ; y imn et y max peuvent prendre les valeurs 0 
et 1 ou -1 et 1. 

Pour tous les sous-modeles, la fonction de transfert lineaire a ete attribute a la couche de sortie. 

Deux techniques de generalisation sont souvent employees avec les algorithmes 
d’apprentissage de retro-propagation du gradient les plus efficaces et les plus couramment utilises 
en biotechnologie. Le sur-apprentissage ou la faible capacite de generalisation survient quand un 
reseau neuronal sur-apprend pendant la phase d’apprentissage. En consequence, un tel modele trop 
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bien forme ne peut pas fonctionner correctement sur un ensemble de donnees non vue dans la phase 
d’apprentissage a cause de son manque de capacite de generalisation. Pour surmonter ce probleme, 
les methodes d’arret premature (en anglais "early stopping") et de regularisation bayesienne ont ete 
appliquees respectivement avec les algorithmes d’apprentissage de Levenberg-Marquardt (trainlm 
en code MATLAB) et de regularisation bayesienne (trainbr en code MATLAB). 

La methode d’arret premature est une pratique tres courante dans l’apprentissage du reseau 
de neurones et produit souvent des reseaux possedant de grandes capacites de generalisation. Cette 
technique est basee sur la repartition des ensembles de donnees en trois parties : apprentissage, 
validation et test. Le reseau est forme avec fensemble d'apprentissage pour minimiser ferreur et 
verifier avec 1’ ensemble de validation apres chaque iteration pour eviter le sur-apprentissage et la 
perte de la capacite de generalisation (Bishop 1995; Pigram et MacDonald 2000). Comme 
verification finale, fensemble de test est utilise pour verifier le bon fonctionnement et la capacite de 
generalisation du reseau forme (Hagan et al 1996; Hirschen et Schafer 2006; Asensio-Cuesta et al 
2010 ). 


La regularisation bayesienne est une approche plus sophistiquee pour ameliorer la 
generalisation. Elle a d'abord ete utilisee par MacKay (1991). Cette methode non seulement 
minimise une combinaison lineaire des erreurs quadratiques et des poids, plutot que la minimisation 
des erreurs quadratiques, mais modifie egalement la combinaison lineaire de sorte qu’a la fin de 
1’ apprentissage, le reseau resultant possede de bonnes qualites de generalisation (MacKay 1991; 
Danaher et al 2004). 

Dans ce travail, les donnees disponibles (551 echantillons) ont ete reparties aleatoirement en 
trois sous-ensembles distincts (Figure III.2), en reservant 60 % de donnees (385 echantillons) pour 
la phase d’apprentissage, 20 % (83 echantillons) pour la phase de validation et les 20 % restantes 
(83 echantillons) pour la phase de test. Lorsque la technique d’arret premature est appliquee, les 
ensembles d'apprentissage et de validation sont utilises aux fins decrites precedemment, alors 
qu’avec la regularisation bayesienne fensemble de validation est ajoute a fensemble 
d’apprentissage pour former les modeles. L'ensemble de test est utilise dans les deux techniques 
pour tester la generalisation des sous-modeles formes. 
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Figure III.l. Organigramme pour le developpement et F optimisation de l’architecture d’un RNFF. 
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Afin d'optimiser l'architecture de chaque sous-modele et determiner ainsi le nombre de 
couches cachees et le nombre de noeuds dans chaque couche cachee, une procedure d'essai et erreur 
est executee (Figure III. 1). Le nombre de couches cachees (L) varie de 1 a 2 couches et le nombre 
de neurones (N) dans chaque couche cachee varie de 3 a 30 neurones (Heaton 2005). 

Les performances des sous-modeles sont evaluees, en termes de la racine de l'erreur 
quadratique moyenne ( REQM ), en utilisant 1' equation suivante : 



(III.5) 


Ou n est le nombre total de donnees ; Y i>pre d represente la sortie predite par le modele neuronal ; Y i>exp 
est la valeur experimentale. 


La procedure d'elaboration du RNFF decrit ci-dessus a ete realisee par l'elaboration d'un 
programme MATLAB sous MATLAB Neural Network Toolbox ver.7.10. Ce programme est utilise 
pour optimiser l'architecture des trois modeles neuronaux employes respectivement pour predire les 
profils de concentration de la biomasse (RNA), du glucose (RMS) et du produit (R NP). 


▲ 



y Apprentissage LI Validation yTest 


Figure III.2. Representation des % de division de la base de donnees. 


III.2.3. Comparaison avec les modeles cinetiques non structures 

La culture fed-batch de pleuromutiline est mise en oeuvre initialement dans un mode batch, 
puis alimentee par une solution concentree de substrat limitant (forme non diluee), resultant en une 
augmentation non significative du volume. La culture fed-batch a volume fixe peut etre decrite par 
les equations suivantes de bilan de masse: 
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dX_ 

dt 



(III.6) 


dt V ' Y xjs dt Y Pjs dt s 

(HI*?) 


dP 

dt 


F 

TLX P 

V 


(III.8) 


Ou X, S et P sont respectivement les concentrations de la biomasse, du substrat et de la 
pleuromutiline ; t est le temps de fermentation ; // est la vitesse specifique de croissance ; n est la 
vitesse specifique de formation de produit ; V est le volume du bioreacteur industriel (culture) ; So et 
F sont respectivement la concentration initiale du substrat et le debit d'alimentation du milieu ajoute 
au bioreacteur ; ms est le coefficient de maintenance ; Y X /s est le rendement de la biomasse par unite 
de masse de substrat et Y P / S est le rendement du produit par unite de masse de substrat. 

Comme le volume V du bioreacteur industriel est tres grand par rapport a 1’ alimentation F , 
le terme F/V est negligeable et par consequent les equations de bilans deviennent (Pirt 1979; 
Stanbury^a/. 1999) : 


dX_ 

dt 



(HI.9) 


dS _ 

1 

dX 

1 

dP 

dt 

Fx/s 

dt 

Y m 

dt 

dP _ 

nX 





-m s X 


(III.10) 


dt 


(III. 11) 


Les vitesses specifiques de croissance et de formation de la pleuromutiline sont modelises 
par les equations suivantes (Patnaik 2001) : 




Afnax ^ 

k s + S 


(III. 12) 
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k s +S + S 2 lk, 


(III.13) 
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Ou ks est la constante de Monod ; ki est la constante d'inhibition ; p max et n max sont respectivement 
les valeurs maximales de p et n. 

Les modelisation cinetiques ont ete effectuees par elaboration d'un programme MATLAB 
base sur les quatre etapes suivante (Cutlip et Shacham 2008): 

1. Initialisation des parametres cinetiques et integration des equations differentielles par 
l’utilisation de la fonction MATLAB M ode45 M et ceux dans le but de calculer les valeurs des 
variables dependantes ; 

2. Calcule de la somme des carres de la difference entre les valeurs calculees et experimentales 
des variables dependantes ; 

3. Application d’un programme d'optimisation base sur la fonction MATLAB "fminsearch", 
qui modifient les valeurs des parametres cinetiques de maniere a obtenir le minimum de la 
somme des carres ; 

4. Reintegration des equations differentielles en utilisant les valeurs optimales des parametres 
cinetiques. 

Les valeurs des variables dependantes ainsi obtenues pour chaque lot sont ensuite comparees a 
celles obtenues par les modeles neuronaux optimises. 

III.2.4. Analyse de sensibilite 

Pour voir la contribution ainsi que le profil de variation de chaque variable d’ entree (t, pH, 
IR, Xo et So) sur la sortie de chaque reseau (RNX, RNS et RNLP), On a procede a une analyse de 
sensibilite par deux methodes differentes : Methode de "Poids" (en anglais ‘Weights’ method) et 
methode de ’'profil" (en anglais ‘Profile’ method). 

III.2.4.1. Methode de "Poids" 

Cette methode, proposee d'abord par Garson (Garson 1991) et reprise par Goh (Goh 1995), 
donne une quantification de T importance relative (Jr) des differentes entrees sur la sortie du RN 
(Gevrey et al. 2003). Elle se base sur le partitionnement des poids de connexions en : 

• Poids de connexions entree -cachee ( vC. ) ; 

• Poids de connexions cachee- sortie ( <)■ 

Le processus de calcul, qui se compose de quatre etapes, est schematise sur Torganigramme 
de la figure III. 3. 
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IIL2.4.1. Methode de " Profit " 

Cette methode a ete proposee par Lek (Lek et al. 1995; Lek et al 1996a; Lek et al 1996b). 
L'idee generate est d'etudier successivement chaque variable d'entree quand les autres sont alors 
bloquees a des valeurs fixes. Le principe de cet algorithme est de construire une matrice Active 
relative a la plage de toutes les variables d'entree (Gevrey et al 2003). La figure III.4 presente un 
schema explicatif general de la methode de profil. Lorsque la variable d’entree Xi est distribute sur 
12 niveaux de variation entre son minimum et son maximum, les autres variables d’ entrees sont 
maintenues fixes, successivement au minimum, le premier quartile, la mediane, le troisieme quartile 
et maximum. Pour chaque valeur de Xi, cinq reponses sont obtenues et c'est la valeur mediane des 
cinq reponses predites par RN qui est prise en compte. Alors le profil de la grandeur de sortie 
(reponse) peut etre trace pour des valeurs de l'echelle de la variable Xi. Cette procedure est repetee 
pour les autres variables. 

Nous avons applique cette methode pour determiner le profil de contribution de chaque 
variable d’entrees simulees (t, pH, IR, Xo et So) sur la biomasse predite par le RNX, sur la 
consommation du sucre calculee par le RMS et sur la formation du produit predite par le RMP. 


These L . Khaouane 


Page 45 


Chapitre III . Modelisation de la fermentation fed-batch de pleuromutiline par les reseaux de neurones 




Figure III.3. Organigramme de la methode de "poids". 
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Figure III.4. Schema explicatif de la methode de "Profil" (Gevrey et al. 2003). 


III.3. Resultats et discussion 

III.3.1. Performances des modeles 

Selon la discussion precedente, trois modeles neuronaux ont ete developpes dans le but de 
predire les pro fils de concentration de la biomasse (RNA), du glucose (RN£) et de la pleuromutiline 
(RNP) pendant la fermentation fed-batch de Pleurotus mutilus. Afin d'optimiser leur structure, 
quatre sous-modeles suivant les algorithmes d'apprentissage et les fonctions de transfert utilisees, 
ont ete developpes pour chaque modele neuronal. 

Le tableau III. 3 et la figure III. 5 resument les performances des sous-modeles, en termes de 
la REQM , pour chaque modele neuronal. Pour le RNX et le RN P, le sous-modele sm3 donne 
l’erreur minimale par rapport aux autres sous-modeles. Pour le RN S, le sous-modele sm2 est le plus 
performant avec une erreur de 0.1234 g/L. Les structures obtenues des modeles neuronaux 
optimises sont representees dans le tableau III. 4. Une couche cachee etait sufflsante pour prevoir 
avec assez de precision les profils de concentration de la biomasse, du substrat et du produit. II a ete 
prouve que falgorithme d’apprentissage de retro -propagation de type regularisation bayesienne 
couplee avec sa technique de generalisation correspondante augmente la capacite d’apprentissage. 



Variables bloquees aux : 


- Minimum 


- premier quartile 


- mediane 


- troisieme quartile 


- maximum 
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La figure III. 6 montre la comparaison entre les valeurs experimentales et les valeurs 
calculees par les modeles neuronaux optimises pour la totalite de la base de donnees. Le tableau 
III. 5 rassemble les vecteurs de regression lineaire pour les trois modeles neuronaux (RNX, RMS et 
RMP), ce tableau montre que les parametres de regression les moins favorables sont ceux obtenus 
pour la prediction du sucre. II est prouve que fapproche neuronale proposee donne des resultats 
satisfaisants avec des valeurs des vecteurs de regression approchant l'ideal [i.e. a= 1 (pente), /?=0 
(ordonnee a rorigine), R= 1 (coefficient de correlation)] dans fajustement des profils de la 
biomasse, du glucose et de la pleuromutiline. 


Tableau III.3. Performances des modeles neuronaux et leurs sous-modeles pour fensemble de test. 


Sous- 

modeles 

R\.\ 

RN5 

RNP 

Nombre de 
neurones 

REQM 

(%) 

Nombre de 
neurones 

REQM 

(g/L) 

Nombre de 
neurones 

REQM 
(10' 2 mg/g) 

Sill 1 

24 

1.1046 

21 

0.2351 

23 

0.54 

sin 2 

29 

0.4826 

25 

0.1234 

21 

0.18 

sin 3 

29 

0.4624 

18 

0.1305 

27 

0.16 

sin 4 

26 

1.1572 

27 

0.2757 

20 

0.6 
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Figure III. 5. Performances des modeles neuronaux (RNX, RNS et RN P) et leurs sous-modeles 

(sml, sm2, sm3 et sm4) pour la base de test. 


Tableau III.4. Structure des modeles neuronaux optimises. 


Modeles 

neuronaux 

Algorithme 

d'apprentissage 

Couche 

d'entree 

Couche cachee 

Couche de sortie 

Nombre de 
neurones 

Nombre de 
neurones 

Fonction 
d' activation 

Nombre de 
neurones 

Fonction 

d'activation 

R\.\ 

trainbr 

5 

29 

logsig 

1 

purelin 

RNS 

trainbr 

5 

25 

tansig 

1 

purelin 

RNP 

trainbr 

5 

27 

logsig 

1 

purelin 
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Produit experimental, P exp (mg de produit / g de biomasse) 


(C) 

Figure III.6. Comparaison entre les valeurs experimentales et calculees par les modeles neuronaux 
optimises pour la totalite de 1’ ensemble de donnees : (a) biomasse, (b) glucose, (c) produit. 


Tableau in. 5. Vecteurs de regression lineaire issue de l’equation lineaire ; y cal = [a 

(pente), /3 (ordonnee a l’origine), R (coefficient de correlation)]. 



Base d’apprentissage 

Base de test 

Totalite de la base 


RNX 

1 

1 

1 

a 

RVV 

1 

0.98 

0.99 

RNP 

1 

1 

1 


RNA 

0.0074 

-0.35 

-0.063 

p 

RN5” 

0.017 

0.29 

0.066 

RNP 

0.0005 

0.0011 

0.0002 


RNX 

0.9999 

0.9991 

0.9998 

R 

RN5” 

0.9995 

0.9967 

0.9989 

RNP 

0.9999 

0.9998 

0.9999 
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III.3.2. Temps d’execution 

II nous a fallu 4 mois pour la collecte des donnees, le pretraitement et la programmation des 
RN en MATLAB. L’execution des programmes est realisee dans Tinterface Windows 7 avec 32 
bits et une RAM de 2 GB, le temps d’execution des programmes est donne dans le tableau III.6. 


Tableau III.6. Temps d’execution. 


RN 

Sous-modele 

Temps d’execution (s) 
du programme du RN 

Temps d’execution (s) 
de simulation du RNO 


sml 

773.8758 

0.0326 

R\\ 

sm 2 

1.0855 10 4 

0.0540 

sin 3 

1.5743 10 4 

0.0720 


sm 4 

771.5629 

0.0340 


sml 

849.6533 

0.0828 

RVS 

sin 2 

9.8922 10 3 

0.0720 

sin 3 

1.3982 10 4 

0.0625 


sin 4 

698.7762 

0.0880 


sml 

908.0220 

0.1268 

RNP 

sm 2 

1.1125 10 4 

0.0990 

sm3 

1.5393 10 4 

0.1250 


sm 4 

1.1888 10 3 

0.1150 


III.3.3. Expressions mathematique des modeles neuronaux optimises 

A partir du RNLS optimise et qui est represente sur la figure III. 7, on peut exprimer 
Tassimilation du substrat par un modele mathematique qui y incorpore toutes les entrees E l (t, pH, 
IR, Xo, So) comme suit: 

Les sorties Zj de la couche cachee: 



i=\ 



(III.14) 


j=l, 2, , 25 

La sortie S : 
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s=j C 


0 


25 

I 

j = 1 


< Z j +b \° 


25 


=y <z,+b? 


j = 1 


(III.15) 


La combinaison des equations (IV. 14) et (IV. 15) mene a la formule mathematique suivante qui 
decrit Tassimilation de substrat en prenant en compte toutes les entrees E t (t, pH, IR, X 0 , So)'. 


25 



7=1 



2 

l + exp(-2 j^WjiEj+bf) 

i = 1 


-1 




o 


(III. 16) 



Figure III. 7. Representation schematique du RMS optimise. 

De meme, les concentrations de la biomasse et de la pleuromutiline peuvent etre exprimees 
par des equations mathematiques extraites des RNV et RN P optimises comme suit: 


29 


7=1 




27 



7=1 


1 

1 + exp(-^ w l ji E i +b") 

i = 1 



(III.17) 


(III.18) 


Ou w represente le poids synaptique de la connexion du neurone i de la couche d’entree au 

J l 

neurone j de la couche cachee ; wfj represente le poids synaptique de la connexion du neurone j de 
la couche cachee au neurone de la couche de sortie ; b 1 ’ et b° representent respectivement les biais 

du neurone j de la couche cachee et du neurone de la couche de sortie. Les matrices des poids et 
biais, des trois RN optimises, sont donnes dans les tableaux III.7, III. 8 et III. 9. 

Comme ces equations mathematiques, derivant des modeles neuronaux optimises, 
contiennent juste le degre exige de complexity et incluent dans leurs formules les caracteristiques 
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pertinentes du bio-processus a savoir les conditions de fonctionnement et les conditions initiates, ils 
peuvent done facilement etre appliques dans des boucles de controle du bio-processus. 


Tableau III.7. Poids et biais du RNX optimal. 


Connexions 

Couche d’entree-Couche cachee 

Connexions 
Couche cachee- 
Couche de sortie 

Poids 

Biais 

Poids 

Biais 

w a 

W J2 

W j 3 

W j 4 

W J 5 

K 

< 


-0.8354 

-1.2637 

0.1349 

2.0221 

-3.2050 

2.0109 

0.7177 


-0.1707 

0.9634 

-0.7157 

0.3131 

0.1681 

-0.4961 

-2.7030 


0.2411 

-1.5332 

-0.1923 

-2.4550 

-0.7520 

0.6709 

1.3862 


-2.8765 

-1.2900 

-0.6103 

0.7585 

-0.6989 

-0.0322 

-0.6418 


0.2558 

-0.0494 

-0.8620 

-0.9874 

-1.9360 

-0.3356 

-1.8420 


-0.1145 

1.7908 

0.0359 

1.5959 

0.2494 

-0.7446 

1.4893 


0.1477 

-1.5980 

-0.9304 

-3.2265 

-1.0579 

-1.9098 

1.1202 


-0.0596 

1.3392 

0.0504 

1 .403 1 

0.6438 

0.8670 

2.2706 


-2.2511 

-0.6470 

0.0841 

1.0809 

-0.1548 

-0.1746 

1.0095 


-1.5418 

0.4175 

0.0599 

0.7850 

-1.3099 

0.7502 

-0.4819 


-0.4349 

0.4342 

0.1578 

-0.4660 

-2.3435 

-0.5555 

0.4432 


-0.9984 

-0.7252 

-1.5541 

0.6684 

1.2499 

-0.5206 

-1.7870 


-1.9264 

-0.3633 

0.2436 

2.1841 

-2.4865 

-1.1252 

1.2719 


0.0922 

-0.8548 

0.3546 

1.5943 

-2.8940 

-0.2157 

-2.3448 


0.1605 

-1.1330 

0.8118 

0.6638 

0.3894 

0.4944 

-1.7971 

-0.7409 

-0.0227 

-1.0143 

0.1729 

2.6873 

-4.9177 

-0.5492 

1.7748 


0.0560 

0.8807 

1.5489 

-0.2283 

0.5415 

-0.6904 

1.3860 


-0.0154 

0.2886 

-1.0549 

-1.1250 

0.0472 

-0.2124 

-2.0431 


-1.1562 

-0.2979 

-1.6549 

-0.3172 

-0.7602 

-0.5490 

1.2609 


1.7440 

-0.3495 

-0.6322 

0.0527 

-0.2098 

1 .7447 

2.5359 


-2.4835 

0.2614 

-1.0163 

1.1579 

1.2635 

-0.3993 

0.2946 


2.8277 

0.8605 

-0.6175 

-0.8095 

0.8307 

0.5505 

0.4555 


1.9439 

-0.2521 

-0.5233 

-2.1297 

1.7090 

0.9802 

1.3903 


0.9562 

-0.7169 

2.2102 

-1.1279 

-2.0820 

1.6698 

-0.6627 


-1.9522 

-0.6736 

0.8961 

0.8283 

4.3211 

-2.4213 

0.5216 


-0.8258 

-0.6182 

-1.2898 

0.1798 

1.2874 

-0.1099 

2.3968 


1.1010 

-0.4139 

0.8712 

-0.4649 

-2.3572 

-0.1412 

0.9812 


2.0325 

0.3207 

0.8679 

0.5312 

0.6171 

-0.5889 

0.6610 


0.8268 

-0.2994 

-1.2249 

-1.0204 

-1.7741 

-0.1208 

1.1387 



These L . Khaouane 


Page 54 


Chapitre III. Modelisation de la fermentation fed-batch de pleuromutiline par les reseaux de neurones 


Tableau III.8. Poids et biais du RNS optimal. 


Connexions 

Couche d’entree-Couche cachee 

Connexions 
Couche cachee- 
Couche de sortie 

Poids 

Biais 

Poids 

Biais 

w n 

W J 2 

W j 3 

W J4 

W J 5 

1 H 

b i 

H 

w v 


1 .4029 

0.8714 

-1.3524 

0.2145 

0.6317 

-0.5115 

-0.7805 


0.4383 

-0.5951 

-1.3384 

1.5204 

1.6494 

0.0779 

-1.7608 


-1.3097 

-0.2949 

-0.8419 

-0.1914 

0.5173 

-1.1387 

2.3025 


-0.3193 

-0.5655 

-0.0312 

2.5081 

-0.6343 

-0.0874 

-3.1198 


-2.4027 

1.8320 

-0.9690 

0.7135 

1.0560 

0.7349 

0.2614 


-0.0598 

0.2705 

0.4831 

-1.0267 

1.9281 

-0.6504 

-1.2773 


-2.4997 

-0.7740 

0.8562 

-2.1614 

-1.1692 

-2.8045 

0.4456 


-2.2833 

-0.8347 

-0.8968 

-1.7699 

-1.0679 

-1.6927 

-1.2422 


0.8948 

-0.6419 

-0.3985 

-0.7658 

0.9061 

0.6613 

-2.0070 


2.1141 

-0.2214 

0.5923 

0.9273 

1.3326 

1.4063 

-1.6233 


0.8029 

-0.2736 

-0.2919 

-1.6149 

4.7477 

2.2088 

1.3013 


-0.9459 

0.2275 

1.1472 

-1.4942 

-2.8577 

-0.5690 

-0.9332 


1.5703 

-0.0496 

1.8765 

-0.6482 

2.0143 

1.6645 

0.8582 

-0.1472 

-0.7951 

1.3593 

0.8056 

-1.2884 

-1.8784 

1.4389 

1.6502 


2.2537 

-0.0248 

-0.3302 

0.2093 

0.7825 

0.8012 

1.2170 


0.7537 

1.5335 

0.9172 

-2.9717 

0.6344 

0.0185 

-1.2831 


-0.2896 

0.5039 

0.2871 

2.3257 

0.1097 

-0.7387 

2.1051 


-0.1246 

-0.8703 

-0.5654 

2.1411 

-4.6610 

-1.7761 

1 .4487 


-1.1202 

-0.3724 

-0.7511 

0.3485 

-0.1365 

-1.0577 

-2.1164 


-1.2842 

-0.6000 

-0.8760 

-0.1215 

-1.5482 

1.0101 

-1.3748 


-0.6424 

-0.3483 

0.6935 

2.6202 

2.5838 

-0.7696 

-1.0314 


0.0404 

-1.0799 

-0.8518 

0.6817 

1.7254 

-0.6435 

1.5352 


2.3093 

-2.7393 

-1.8759 

0.9396 

0.2019 

-0.1160 

0.3811 


-0.6783 

-1.7623 

-1.9056 

-0.9479 

-0.4731 

0.4227 

1.2703 


0.6327 

-0.2987 

1.3779 

1.5440 

1.2748 

0.0593 

1.5599 
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Tableau III.9. Poids et biais du RN P optimal. 


Connexions 

Couche d’entree-Couche cachee 

Connexions 
Couche cachee- 
Couche de sortie 

Poids 

Biais 

Poids 

Biais 

w n 

W J2 

W j 3 

W J 4 

W J5 

iH 

h j 

H 

w if 


- 2.9269 

-1.4263 

-7.2014 

6.3928 

1.8073 

-3.9187 

-1.6162 


1.1146 

-1.2153 

0.4311 

-5.4334 

-1.9241 

2.9022 

-6.4467 


0.3890 

-2.3302 

-6.0827 

1.4968 

2.1090 

0.7316 

-2.0319 


8.2538 

-1.4353 

1.3024 

-6.0739 

6.5412 

-3.4397 

-0.6263 


8.4439 

-0.0844 

-0.4511 

-7.3537 

5.1683 

0.5437 

-0.4524 


-0.7579 

1 .4007 

0.4931 

7.1490 

4.8052 

-6.4504 

-8.0603 


-1.9866 

-1.3324 

-2.2629 

2.9612 

-1.5593 

-0.9006 

3.2565 


-4.1809 

-0.9944 

6.9592 

-0.8699 

-6.5638 

6.4973 

1.9482 


-6.7334 

1.0292 

3.5748 

-0.7967 

3.1997 

2.3931 

1.1469 


2.5570 

-1.0137 

-3.1749 

4.1644 

0.8190 

-3.4140 

4.6223 


0.4549 

-2.2869 

-1.9826 

-8.0184 

-7.3070 

10.0426 

-3.2575 


3.8836 

-4.7567 

-5.6697 

2.3926 

0.8384 

1.5620 

0.7641 


0.7223 

-0.6695 

0.4233 

-4.7059 

2.9251 

-0.2904 

3.8255 


-2.3481 

0.6829 

1.7264 

-5.6177 

-3.3177 

5.3658 

5.5468 

-0.2192 

2.2828 

1.1771 

-4.6640 

-0.8588 

4.7092 

-4.5815 

5.8573 


0.2189 

0.6469 

1.6344 

-3.2380 

-4.7119 

3.4996 

-3.8437 


-2.4529 

0.2741 

2.0833 

0.3341 

0.1276 

0.3031 

-6.1021 


1.2915 

-1.5857 

2.7867 

6.1771 

2.9904 

-1.1936 

4.9541 


1.4878 

-1.5809 

-0.5043 

0.3089 

-1.1925 

0.7875 

-5.0642 


-4.2033 

1.7703 

0.9559 

3.3474 

9.0597 

-6.0420 

1.9917 


4.0350 

-0.5836 

-2.2463 

4.7719 

8.4582 

-8.7975 

2.5084 


2.6220 

-0.4797 

-2.3259 

-3.7764 

6.7859 

-3.8903 

-2.1910 


1.8278 

1.1449 

-2.3150 

0.3273 

3.4368 

-4.8187 

-6.9692 


-1.6494 

1.0795 

-3.1726 

-12.4793 

-3.9320 

2.5699 

3.8432 


7.6263 

-1.2788 

-1.9833 

-0.1160 

-2.5358 

0.0436 

-0.8434 


2.1441 

0.8696 

1.7867 

6.6175 

-2.6741 

-3.5789 

1.6261 


2.7848 

-1.5431 

0.1194 

-1.7920 

-4.1354 

2.8878 

5.6397 
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III.3.4. Comparaison avec les modeles cinetiques non structures 

Afin d'etablir les modeles neuronaux optimises (RNX, RMS et RN P) en tant qu ? alternative 
plausible aux modeles cinetiques non structures (MCA, MGS et MGP), une comparaison entre les 
deux approches a ete faite en termes de resultats de modelisation. Ces resultats sont illustres sur la 
figure III. 8 pour les lots 2, 4, 9 et 17. Les resultats des autres lots (lots 1,3,5, 6, 7, 8, 10, 11, 12, 13, 
14, 15, 16, 18 et 19) sont represents en Annexe. Ces resultats montrent que les modeles des RNFF 
developpes surpassent les modeles cinetiques non structures dans la prediction des profils de 
concentration de la bio masse, du glucose et de la pleuromutiline ; il est a note aussi que le 
phenomene de fermentation industrielle de pleuromutiline, avec sa phase d’ acceleration, sa phase 
exponentielle de croissance, sa phase de deceleration et sa phase stationnaire, est bien presente pour 
tous les lots. Les equations proposees pour decrire les taux specifiques de croissance et de 
formation du produit sont appropriees pour quelques ensembles de donnees (lots) et peu 
convenables pour d'autres. Ceci peut etre du au changement du comportement de la souche 
Pleurotus mutilus d’un lot a un autre. Ceci exigera probablement une modification des equations des 
taux specifiques d'un lot a un autre, ce qui rendra difficile leur incorporation dans une boucle de 
controle du processus. 


70 



(D 
c n 

C/) 

cu 

E 

o 

bo 


r 24 
- 22 

- 20 

- 18 

- 16 

- 14 

- 12 



Temps de fermentation (h) 



co 


r 6 


- 5 

- 4 

- 3 

- 2 
- 1 



- 0 


3 

■o 

o 

Q_ 


L -1 



These L . Khaouane 


Page 57 


Chapitre III. Modelisation de la fermentation fed-batch de pleuromutiline par les reseaux de neurones 






These L. Khaouane 


Page 58 


Chapitre III . Modelisation de la fermentation fed-batch de pleuromutiline par les reseaux de neurones 



(d) 

Figure III.8. Resultats de modelisation: (a) lot N°2, (b) lot N°4, (c) lot N°9, (d) lot N°17. (Les donnees 
experimentales (symboles) pour la biomasse (•), glucose (■) et pleuromutiline (A ); Les resultats de la modelisation 
par RNFF sont represents par des traits pleins et les resultats de la modelisation cinetique sont presentes par des lignes 

en pointilles) 

Afin de visualiser encore plus les capacites predictives des modeles neuronaux (RN) par 
rapport aux modeles cinetiques non structures (MC), nous avons etabli une deuxieme comparaison 
en termes d’analyse statistique a travers le calcul de la REQM (Equation III. 5) et l’erreur standard 
de prediction (ESP) (Equation III. 1 9). 


ESF(%)= 


REQM 


Y e 


xlOO 


(III.19) 


n 



Y e = — (III.20) 

n 

Ou Y hexp est la valeur experimentale ; Y e est la moyenne des donnees experimentales ; n est le 
nombre de points experimentaux. 

Les resultats de la comparaison entre les reseaux de neurones optimises (RN) et les modeles 
cinetiques (MC), en termes de la REQM et YESP, sont presentes sur l’histogramme de la figure III. 9 
et dans le tableau III. 10. Ces resultats indiquent que les deviations des predictions obtenues par les 
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modeles neuronaux optimisees sont nettement plus faibles que celles obtenues par les modeles 
cinetiques non structures. 



Figure III.9. Comparaison entre les reseaux de neurones optimises (RN) et les modeles cinetiques 
(MC) pour la totalite de la base de donnees : (a) en termes de la REQM , (b) en termes de V ESP. 
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Tableau III.10. Comparaison, en termes de la REQM et 1 'ESP, entre les reseaux de neurones optimises (RN) et les modeles cinetiques (MC). 


Lots 

REQM 

ESP (%) 

Biomasse 

Substrat 

Produit 

Biomasse 

Substrat 

Produit 

RNJVT 

MCX 

RMS 

MCS 

RN P 

MC P 

RNX 

MCX 

RMS' 

MGS' 

RMP 

MGP 

Lot 1 

0.2510 

1.1132 

0.2072 

0.5854 

0.0319 

0.1139 

0.5050 

2.2403 

1.4788 

4.1773 

1.4139 

5.0502 

Lot 2 

0.3232 

1.4080 

0.0930 

0.8741 

0.0294 

0.2702 

0.6159 

2.6833 

0.6759 

6.3552 

1.1927 

10.9449 

Lot 3 

0.3632 

1.3390 

0.1055 

1.0631 

0.0237 

0.0975 

0.7245 

2.6709 

0.6655 

6.7055 

1.0707 

4.4109 

Lot 4 

0.4174 

1.0602 

0.1099 

0.2195 

0.0372 

0.1846 

1.0283 

2.6120 

0.6291 

1.2563 

1.6825 

8.3508 

Lot 5 

0.6852 

1.1420 

0.3302 

1.0695 

0.0198 

0.2889 

1.6286 

2.7142 

2.0919 

6.7762 

0.6090 

8.8698 

Lot 6 

0.4548 

1.6057 

0.2575 

1.3489 

0.0277 

0.2941 

0.9917 

3.5016 

1.7586 

9.2119 

0.8931 

9.4934 

Lot 7 

0.2286 

2.3259 

0.1612 

0.3096 

0.0150 

0.1322 

0.5251 

5.3417 

1.0358 

1.9893 

0.7041 

6.1884 

Lot 8 

0.3808 

1.7642 

0.1918 

0.5418 

0.0221 

0.0751 

0.8976 

4.1588 

1.2835 

3.6253 

0.9592 

3.2581 

Lot 9 

0.3430 

1.3522 

0.3188 

1.0505 

0.0344 

0.1480 

0.7768 

3.0628 

1.9547 

6.4409 

1.2571 

5.4125 

Lot 10 

0.1876 

1.6143 

0.1582 

0.3973 

0.0226 

0.4178 

0.4235 

3.6437 

1.0438 

2.6213 

0.6653 

12.3046 

Lot 11 

0.1188 

1.5770 

0.1260 

0.5196 

0.0450 

0.5531 

0.2682 

3.5597 

0.9598 

3.9577 

1.1308 

13.8950 

Lot 12 

0.3251 

0.6266 

0.1575 

0.2756 

0.0192 

0.2075 

0.7321 

1.4109 

1.1850 

2.0741 

0.6764 

7.3027 

Lot 13 

0.2098 

1.2592 

0.1592 

0.9099 

0.0197 

0.4401 

0.4563 

2.7382 

1.1996 

6.8565 

0.7186 

16.0178 

Lot 14 

0.2385 

1.0587 

0.1853 

0.4143 

0.0247 

0.3021 

0.5271 

2.3398 

1.1288 

2.5241 

0.7935 

9.6953 

Lot 15 

0.2266 

0.8469 

0.1042 

0.3867 

0.0278 

0.2846 

0.5011 

1.8723 

0.6151 

2.2835 

0.9965 

10.2021 

Lot 16 

0.4578 

1.0504 

0.2476 

0.6278 

0.0263 

0.3760 

1.0294 

2.3616 

1.5174 

3.8466 

0.7867 

11.2582 

Lot 17 

0.3390 

0.9668 

0.2431 

1.0985 

0.0319 

0.3902 

0.7663 

2.1859 

1.5757 

7.1189 

1.2318 

15.0731 

Lot 18 

0.3049 

1.2522 

0.1752 

0.5615 

0.0202 

0.1689 

0.6765 

2.7780 

1.1803 

3.7825 

0.8321 

6.9608 

Lot 19 

0.4497 

0.8417 

0.2292 

0.4131 

0.0329 

0.3380 

1.0395 

1.9458 

1.6828 

3.0336 

1.1479 

11.7813 

Ensemble 
des lots 

0.3548 

1.3297 

0.1993 

0.7427 

0.0279 

0.2965 

0.7862 

2.9465 

1.3203 

4.9213 

1.0036 

10.6760 
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III.3.5. Performances (Tinterpolation 

Pour verifier encore plus la capacite de generalisation de ces trois modeles neuronaux 
precedemment developpes et optimises, deux types de bases de donnees d'interpolation ont ete 
utilises : 

1. La premiere base de donnees contient un ensemble de points intermediates entre les points 
experimentaux du lot numero 6 (le lot numero 6 a ete choisi au hasard) ; 

2. La deuxieme base de donnees d’interpolation contient un ensemble de donnees comp let 
jamais exploite pendant la phase d’apprentissage et de test: Xo= 3 % et So= 23.5g/L. 

Les resultats de performances d’interpolation en termes de la REQM et en termes du 
coefficient de correlation ( R ) sont resumes dans le tableau III. 11 et presentes sur la figure III. 10. La 
qualite de l’ajustement de Tinterpolation du premier ensemble de donnees est representee sur la 
figure III.ll. Un excellent ajustement aux valeurs experimentales de la biomasse, du sucre et du 
produit est note. Les resultats de la simulation de la seconde base de donnees d'interpolation sont 
illustres sur la figure III. 12. On peut observer que le RNX et le RN P s’ajuste tres bien aux points 
experimentaux de la biomasse et du produit respectivement ; Cependant, les resultats du RMS 
s’ajustent moins bien aux concentrations experimentales de glucose. 

Bien que la precision des modeles neuronaux fut moderement satisfaisante, en particulier 
pour le RMS, plus de donnees historiques couvrant Tensemble du champ d’interet doivent etre 
ajoutees a la phase d’apprentissage afln d’augmenter de plus en plus la qualite predictive des 
modeles neuronaux. 


Tableau III.ll. Resultats d'interpolation, en termes de la REQM et du coefficient de correlation ( R ). 



l ere base de donnees 
d'interpolation 

2 eme base de donnees 
d'interpolation 

REQM 

R 

REQM 

R 

R\.\ 

0.1565 

0.9997 

1.7100 

0.9988 

RN5 

0.0531 

0.9991 

2.1810 

0.9508 

RNP 

0.0006 

0.9999 

0.0797 

0.9995 
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Premiere base de 
donnees 
d'interpolation 


Deuxieme base de 
donnees 
d'interpolation 


RNX 


y RNX RNS y RNP 




Premiere base de 
donnees 
d'interpolation 


Deuxieme base de 
donnees 
d'interpolation 


y rnx y rns y rnp 



Figure III.10. Representation des resultats de T interpolation : (a) en termes de la REQM , (b) en 

termes du coefficient de correlation ( R ). 
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Figure III. 11. Resultats de simulation de la premiere base de donnees d'interpolation. 

(Les donnees interpolees experimentales (symboles) pour la biomasse (o), glucose (□) et pleuromutiline (A); 

Les resultats de la modelisation par RNFF sont representes par des traits pleins) 
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Figure III.12. Resultats de simulation de la seconde base interpolation: Xo= 3% et 5^=23. 5g/L. 
(Les donnees experimentales Interpolees (symboles) pour la biomasse (O), glucose (□) et pleuromutiline 
(A); Les resultats de modelisation par RNFF sont representes par des traits pleins) 
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III.3.6. Analyse de sensibilite 

Pour voir la contribution ainsi que le profil de variation de chaque variable d’ entree (t, pH, 
IR, Xo et So) sur la sortie de chaque reseau (RNX, RNS et RNP), On a procede a une analyse de 
sensibilite par la methode de "Poids" et la methode de ’'Profil". 

III.3.6.1. Methode de "Poids" 

Cette methode a ete appliquee respectivement aux RNX, RMS et RN P en utilisant leurs poids 
respectifs illustres dans les tableaux III.7, III. 8 et III.9. Les contributions des variables d'entree 
obtenues par la methode de "poids" pour chaque RN sont presentees sur la figure III. 13. 



fiat U pH MIR MXO fia so 


Figure III.13. Presentation des % de V importance relative (/r) de chaque variable d’entree sur la 
bio masse (RNA), sur la consommation du sucre (RNS) et sur le produit (R NP). 
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D’apres la figure III. 13, on remarque que la concentration initiale du substrat, la 
concentration initiale d’inoculum et le temps de fermentation exercent les contributions les plus 
importantes et ceux pour chaque RN. Pour le RNX, les contributions du pH et de YIR ne sont pas 
significativement differentes (ils ont la meme contribution avec une Ir de 16%), alors que pour les 
deux autres RN (RN S et RNP), YIR exerce une contribution plus importante que le pH. 

III. 3. 6.2. Methode de " Profit " 

Nous avons applique cette methode pour determiner le profil de contribution de chaque 
variable d’entrees simulees (t, pH, IR, Xo et So) sur la biomasse predite par KNX (Figure III. 14), la 
consommation du sucre calculee par RNLS (Figure III. 15) et la formation du produit predite par RN P 
(Figure III. 16). 

D’apres la figure III. 14 presentant les graphes du profil de contribution des variables d’entrees 
( t , pH, IR, Xo et So) sur la biomasse predite par le RNX, on constate que : 

• La biomasse augmente avec 1’ augmentation du temps de fermentation ( t ) jusqu'a la 
valeur de 1 80 h ; au dela de cette valeur la biomasse est presque constante, indiquant 
ainsi la phase stationnaire de croissance (Figure III. 14 (a)); 

• L’ augmentation du pH au cours de la fermentation est peu influente sur la biomasse, 
cependant, pour les valeurs de pH depassant les 7.2, une diminution legere peu etre 
observee (Figure III. 14 (b)); 

• Les faibles valeurs de YIR sont peu influentes sur la biomasse tandis que les grandes 
valeurs favorisent la croissance cellulaire (Figure III. 14 (c)); 

• La concentration initiale de 1’ inoculum est peu influente sur la biomasse predite par le 
RNX (Figure 111.14(d)); 

• La croissance cellulaire decroit avec 1’ augmentation de la concentration initiale du 
substrat So (Figure III. 14 (e)), indiquant ainsi une inhibition de la biomasse par So, 

Pour la figure III. 15 presentant les graphes du profil de contribution des variables d’entrees (t, 
pH, IR, Xo et So) sur la concentration du substrat predite par le RN S, on remarque que : 

• La concentration du substrat decroit avec 1’ augmentation du temps de fermentation ( t ) 
(Figure III. 15 (a)) et croit avec 1’ augmentation de YIR (Figure III. 15 (c)); 

• Pour les faibles valeurs du pH (pH < 6.6), la concentration du substrat augmente 
montrant ainsi la non consommation du substrat par la souche Pleurotus mutilus ; alors 
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que, pour les pH eleves (pH > 6.6), la concentration du substrat diminue indiquant la 
consommation du substrat par Pleurotus mutilus (Figure III. 15 (b)); 

• La concentration initiale de l’inoculum est peu influente sur le substrat predit par le RNS 
(Figure III. 15 (d)); 

• Pour les valeurs de So inferieures a 24 g/1, la concentration du substrat predite augmente, 
montrant ainsi une accumulation du substrat ; alors que pour les So depassant les 24 g/1, 
la concentration du substrat diminue illustrant done la consommation du substrat par la 
souche (Figure III. 15 (e)) ; 

A partir des graphes du profil de contribution des variables d’ entrees (t, pH, IR, X 0 et So) sur la 
production de la pleuromutiline predite par le RN P et qui sont illustres sur la figure III. 16, on peut 
tirer les constatations suivantes : 

• La production de pleuromutiline debute a partir de 50h, puis augmente lineairement avec 
l’augmentation du temps de fermentation (Figure III. 16 (a)) ; 

• La production de pleuromutiline decroit avec Faugmentation du pH (Figure III. 16 (b)) ; 

• La concentration de pleuromutiline diminue avec Faugmentation de YIR jusqu’a ce quelle 
s’annule pour les valeurs depassant les 5 (Figure III. 16 (c)) ; 

• La forme de variation de la pleuromutiline predite par le RN P en fonction de Xo est presque 
sinuso’idale, montrant ainsi la forte contribution de cette variable sur la production de 
pleuromutiline, on remarque aussi que les valeurs de X 0 comprise entre 5.5 et 6.5 % sont les 
plus favorables pour avoir une production maximale (Figure III. 16 (d)). 

• Plus So augmente plus la production augmente jusqu’a la valeur de 27g/l, au dela de cette 
valeur la production diminue (Figure III. 16 (e)). 
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Chapitre III. Modelisation de la fermentation fed-batch de pleuromutiline par les reseaux de neurones 




(a) (b) 




( c ) (d) 



(e) 


Figure III. 14. Graphes du profll de contributions des variables simulees (/, pH, IR, Xi, et So) sur la 
biomasse predite par RNX : (a) effet de t, (b) effet du pH, (c) effet de YIR, (d) effct de A',, (e) efFet de So. 
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Figure III.15. Graphes du profil de contribution des variables simulees (t, pH, IR, X 0 et So) sur le 
substrat predit par RMS’: (a) effet de t, (b) effet du pH , (c) effet de VIR, (d) effet de X (h (e) effet de S 0 . 
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Chapitre III. Modelisation de la fermentation fed-batch de pleuromutiline par les reseaux de neurones 




(a) 


(b) 




(c) 


(d) 



(e) 


Figure III.16. Graphes du profil de contribution des variables simulees (/, pH, IR, A’„ et So) sur le 
produit predit par RNP: (a) effet de t, (b) cffct du pH, (c) effet de 1 ’IR, (d) cffct de X, h (e) cffct de S 0 . 
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Les contributions relatives de chaque variable d’ entree ont ete exprimees par les valeurs de 
l’intervalle (maximum-minimum) de leurs contributions (Figure III. 17). On constate que, pour 
chaque RN les % de contributions relatives de chaque variable depasse les 5%, montrant ainsi 
Fimportance des cinq variables sur les sorties des RN. 

Cette analyse de sensibilite par les deux methodes utilisees montre a posteriori Fimportance 
des cinq parametres choisis pour la modelisation de la cinetique de fermentation de la 
pleuromutiline et constitue par consequent une justification du choix postule anterieurement. 



Figure III.17. Presentation des % de contribution relative de chaque variable d’ entree sur la 
bio masse (RNX), sur la consommation du sucre (RNLS) et sur le produit (RNP). 
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III.4. Conclusion 

Ce present chapitre a donne une raison de plus pour Tutilisation generalisee des reseaux de 
neurones artificiels de type feedforward pour la modelisation de la fermentation d'antibiotiques. On 
a developpe trois modeles de RNFF capables d'evaluer trois variables principals du bioprocede de 
fermentation fed-batch de pleuromutiline a savoir la biomasse, la consommation du substrat et la 
formation du produit. Les resultats ont montre une bonne concordance entre les valeurs predites et 
experimentales pour chaque modele neuronal (les REQM pour la base test etaient respectivement de 
0,4624% - 0,1234 g/1 et 0,0016 mg/g pour RNX, RNS et RNP). 

Par comparaison aux modeles cinetiques non structures, les modeles neuronaux optimises 
ont pu predire avec suffisamment de precision les profils de concentrations pour tous les ensembles 
de donnees. De plus, les formules mathematiques obtenues a partir de ces modeles optimises 
englobent non seulement les elements importants du processus, mais ils sont aussi moins 
complexes, faisant leur integration dans une boucle de controle industriel du processus plus facile. 
Cependant, la modelisation par reseaux de neurones artificiels ne peut pas remplacer la 
modelisation cinetique lorsqu'on tente de comprendre le phenomene de fermentation. 

L’ analyse de sensibilite par les deux methodes utilisees (methode de "Poids" et methode de 
"Profil") a montre a posteriori l’importance des cinq parametres (t, pH, IR, Xo et So) choisis pour la 
modelisation de la cinetique de fermentation de pleuromutiline. 
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Chapitre IV. Optimisation hybride des conditions de culture de Pleurotus mutilus 


IV. 1. Introduction 

Dans ce chapitre, nous presentons une methodologie hybride, basee sur un plan composite 
centre (PCC), un reseau de neurones (RN) et un algorithme d’ optimisation par essaim de particules 
(OEP). Cette technique est utilisee pour optimiser les conditions de culture de Pleurotus mutilus 
(vitesse d’agitation, temperature et pH initial) et ceux dans le but d’obtenir une production 
maximale en pleuromutiline. Le PCC est utilise pour concevoir fexperience, le RN forme avec 
ralgorithme d’OEP (RNOEP) sert a developper une fonction mathematique reliant le rendement en 
pleuromutiline avec les trois facteurs. Ensuite, un algorithme generique d’OEP est applique pour 
executer la tache d’optimisation de la fonction mathematique. Les resultats de 1’ optimisation des 
conditions de culture de Pleurotus mutilus ont ete publies dans le "Biotechnology and Bioprocess 
Engineering" (Khaouane et al. 2012a) et presente a la 3 eme Journee Scientifique sur le Genie des 
Procedes (JSGP3-2012) qui s’est tenue a l’Universite Saad Dahlab de Blida, le 19 novembre 2012 
(Khaouane et al 2012b). 

Le chapitre est organise en cinq parties : 

• La premiere partie aborde les materiels et les differentes techniques utilisees lors du 
suivi des experiences de fermentation ; 

• Dans un deuxieme temps, les differentes etapes utilisees dans le developpement de la 
methodologie hybride sont presentees ; 

• Les differents logiciels utilises, pour la modelisation et V optimisation, sont ensuite 
presentes ; 

• La quatrieme partie est consacree a la discussion des resultats significatifs obtenus ; 

• Dans la cinquieme partie, une comparaison de la methodologie hybride proposee avec 
d’autres methodologies d’optimisation a base des RN est illustree. 

IV.2. Materiels et methodes 

IV.2.1. Souche 

La souche Pleurotus mutilus a ete fournie par le Laboratoire de Microbiologie Industrielle 
de la flliale ANTIBIOTICAL du groupe industriel SAIDAL. La souche etait conservee sur slants au 
refrigerateur a +4 °C et repiquee a intervalles reguliers (1 mois) sur un milieu gelose (Conseil de 
l'Europe 2001). 
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IV.2.2. Les milieux de culture 

Deux milieux de culture ont ete utilises selon les objectifs poursuivis. Dans tous les cas le 
pH est ajuste avant la sterilisation avec la soude NaOH a 20 % et le milieu de culture est sterilise 
par autoclavage a 121°C pendant 30 minutes pour le milieu vegetatif et pendant 20 minutes pour le 
milieu de fermentation (Conseil de l'Europe 2001). 

IV.2.2. 1. Milieu liquide vegetatif 

Ce milieu de germination de composition decrite dans le tableau IV. 1 est ajuste a un pH de 
6.0 (Conseil de l'Europe 2001). 

Tableau IV. 1. Composition du milieu liquide vegetatif (Conseil de l'Europe 2001). 


Constituant 

Composition 

Dextrose monohydrate (C 6 H 12 O 6 .H 2 O) 

50 g 

Liqueur de mais macere 

37.5 g 

Phosphate de potassium monobasique (KH 2 PO 4 ) 

1 g 

Sulfate de magnesium heptahydrate (MgSCU.TEEO) 

0.5 g 

Nitrate de calcium tetrahydrate (Ca(N 0 s) 2 . 4 H 20 ) 

0.72 g 

Chlorure de sodium (NaCl) 

0.1 g 

Sulfate ferrique heptahydrate (FeSCU.TEEO) 

0.05 g 


IV.2.2. 2. Milieu liquide de fermentation 

Ce milieu de fermentation de composition decrite dans le tableau IV. 2 est ajuste a un pH de 
7 (Conseil de l'Europe 2001). 

Tableau IV.2. Composition du milieu liquide de fermentation (Conseil de l'Europe 2001). 


Constituant 

Composition 

Dextrose monohydrate (C 6 H 12 O 6 .H 2 O) 

60 g 

Amidon 

30 g 

Liqueur de mais macere 

45 g 

Huile de soja 

2 cm 3 

Sulfate de magnesium heptahydrate (MgSCU.TEEO) 

0.38 g 
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IV.2.3. Les conditions de culture 
IV.2.3.1. Germination 

Pour la phase de germination, des fioles de capacite de 500 ml et contenant chacune 70 ml 
du milieu liquide vegetatif sont inoculees avec 4 ml de suspension de spores prelevees a partir des 
slants frais ou de conservation (faire un scraping de toute la surface blanche developpee a l’aide 
d’une pipette sterile avec 8 ml d’eau physiologique sterile). Les fioles sont ensuite incubees a 27 °C 
pendant 72 h dans un agitateur rotatif a 240 tr/min. La forme vegetative est consideree mature si elle 
repond aux criteres suivants (Conseil de l'Europe 2001) : 

- pH : entre 6,2 et 6,5 ; 

- Biomasse : entre 20 et 35 % ; 

- Observation a l’oeil nu : culture legerement jaunatre ; 

- Observation microscopique : le mycelium en pellettes claires avec hyphes siphonnes et 
ramifiees. 


IV.2.3. 2. Culture en batch 

Pour la culture en batch, des fioles de capacite de 500 ml et contenant chacune 70 ml du 
milieu de fermentation sont inoculees avec 7 ml de bouillon preleve a partir des fioles de 
germination bien developpees. Les fioles sont ensuite incubees pendant neuf jours dans un agitateur 
rotatif (Conseil de l'Europe 2001). La vitesse d'agitation, la temperature d’incubation et le pH initial 
sont variees au cours de ce stade de fermentation selon un PCC. 


IV.2.4. Methodes analytique 
IV.2.4.1. Analyse de la biomasse 

La determination du % de sedimentation dans l’echantillon du bouillon est faite par 
centrifugation. Pour cela des tubes coniques a la base et gradues jusqu’a 10 ml congus pour la 
centrifugation (Figure IV. 1) sont remplies avec 10 ml du bouillon puis centrifuges a 3000 tr/min 
pendant 10 min. Le pourcentage de sedimentation est calcule par la formule suivante (Conseil de 
l'Europe 2001) : 



10 (A+Ah 

~ ^max 


(IV.l) 


Ou Li et L 2 represented les niveaux du culot et L max le niveau du surnageant (Figure IV. 2). 
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Figure IV. 1. Tubes coniques pour sedimentation. 



Figure IV.2. Representation des hauteurs Ly, L 2 et L max - 
IV.2.4.2. Analyse du produit 

Pour Textraction de pleuromutiline, 20 ml de methanol sont ajoutes a 10 g du bouillon de 
fermentation dans un ballon de 1 00 ml et mis sous agitation pendant 1 0 min. Apres filtration avec 
un papier Wattman N° 42, les filtrats sont analyses par chromatographie en phase liquide a haute 
performance (HPLC) en utilisant une colonne en phase inverse C-18 a un debit de 1 ml/min avec 
une detection a 212 nm. La phase mobile est composee de methanol (10 %), d’acetonitrile (40 %) et 
d’une solution de tampon phosphate (50 %) (Conseil de l'Europe 2001). 

IV.3. Description de la methodologie hybride 

IV.3.1. Plan composite centre (PCC) 

Une etude faite par Benkortbi (Benkortbi 2008) a revele que la vitesse d'agitation, la 
temperature et le pH initial dans les conditions de culture de Pleurotus mutilus sont des variables 
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significatives pour la production de pleuromutiline. La temperature est un facteur qui affecte 
profondement la croissance des micro-organismes. Le pH q st un indicateur de l’acidite ou de la 
basicite du bouillon de fermentation, il foumit des informations sur 1’ evolution favorable ou 
defavorable de la culture. La vitesse d’agitation est un facteur determinant dans la fermentation ou 
elle intervient a trois niveaux (Castro-Martinez 2007) : 

i. Elle augmente les echanges entre les micro-organismes et les constituants du milieu de 
culture ; 

ii. Elle augmente la concentration de l’oxygene dissout dans le milieu ; 

iii. Elle entraine les effets de cisaillements sur les micro-organismes. 


Le domaine experimental et les niveaux des trois facteurs independants sont presentes dans 
le tableau IV.3. La variable dependante est le rendement en pleuromutiline. Un PCC, regroupant 20 
experiences au total, a ete genere par le logiciel statistique Modde 5,0 (Umetrics). Le PCC comporte 
trois parties (Tableau IV.4) : 


i. 


u. 


m. 


Un plan factoriel complet a deux niveaux et trois facteurs (2 3 =8 experiences) ; 

Six points axiaux situes a une distance egale a deux du centre du domaine d’ etude ; 
Six points centraux. 


Tableau IV.3. Domaine experimental et niveaux de chaque facteur. 


Facteur 

Symbole 

Intervalle et niveaux 

-2 

-1 

0 

1 

2 

Vitesse d'agitation (tr/min) 

X, 

200 

220 

240 

260 

280 

Temperature (°C) 

X 2 

25 

26 

27 

28 

29 

pH 

x 3 

4 

5 

6 

7 

8 
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Tableau IV.4. Matrice d’ experimentation et rendement experimental. 


Essai 

Xj 

x 2 

x 3 

Rendement 
Experimental 3 (pg/g) 

1 

220 (-1) 

26 (-1) 

5 (-1) 

3658 ±210 

2 

260 (+1) 

26 (-1) 

5 (-1) 

5344 ± 151 

3 

220 (-1) 

28 (+1) 

5 (-1) 

3078 ± 150 

4 

260 (+1) 

28 (+1) 

5 (-1) 

5735 ±370 

5 

220 (-1) 

26 (-1) 

7(+l) 

4383 ±240 

6 

260 (+1) 

26 (-1) 

7 (+1) 

6606 ±21 

7 

220 (-1) 

28 (+1) 

7 (+1) 

4179 ± 100 

8 

260 (+1) 

28 (+1) 

7 (+1) 

4720 ± 560 

9 

200 (-2) 

27 (0) 

6(0) 

7150 ±150 

10 

280 (+2) 

27 (0) 

6(0) 

7350 ± 150 

11 

240 (0) 

25 (-2) 

6(0) 

4925 ± 175 

12 

240 (0) 

29 (+2) 

6(0) 

6375 ± 125 

13 

240 (0) 

27 (0) 

4 (-2) 

650 ±98 

14 

240 (0) 

27 (0) 

8 (+2) 

6210 ± 192 

15 

240 (0) 

27 (0) 

6(0) 

8186 ±548 

16 

240 (0) 

27 (0) 

6(0) 

7899 ± 34 

17 

240 (0) 

27 (0) 

6(0) 

7897 ± 420 

18 

240 (0) 

27 (0) 

6(0) 

8111 ±295 

19 

240 (0) 

27 (0) 

6(0) 

8125 ± 125 

20 

240 (0) 

27 (0) 

6(0) 

7925 ± 175 


a Moyenne de deux lectures 


IV.3.2. Moderation predictive : Description du modele neuronal RNOEP 

Afm de relier le rendement en pleuromutiline avec la vitesse d’ agitation, la temperature et le 
pH initial, on a construit un modele predictif a base de RN type feedforward (RNFF). Le RNFF 
propose renferme trois couches: une couche d'entree avec trois noeuds representant les facteurs 
etudies, une seule couche cachee (une seule couche cachee est jugee suffisante vue le nombre limite 
des points experimentaux) et une couche de sortie avec un neurone generant la valeur estimee du 
rendement en pleuromutiline (F). 
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Afin de rendre l’apprentissage du RNFF plus efficace en empechant la fonction de transfert 
de devenir sature et rendre l’apprentissage tres rapide, toutes les variables d’entree et de sortie ont 
ete normalisees dans fintervalle (IN) 0 a 1 et-1 a 1 suivant la fonction de transfert attribute a la 
couche cachee FTCC (log-sigmoide ou tangente hyperbolique sigmo'ide, respectivement), en 
utilisant 1' equation de normalisation suivante : 



f 


(y — v ) 

max s mm / 


x — X 

min 


A 


v x — x , 
V max mm J 


+7 


mm 


(IV. 2) 


Ou xn est la valeur normalisee du parametre x (vitesse d’agitation, temperature, pH initial et Y) ; 
x max et x m i n sont respectivement les valeurs maximales et minimales de x; y min et y max peuvent 
prendre les valeurs 0 et 1 ou -1 et 1. 

La fonction de transfert lineaire "purelin" a ete attribute a la couche de sortie. 

L'algorithme d’OEP (trainpso en code MATLAB) est utilise dans l’apprentissage du reseau 
de neurones (ce reseau est note RNOEP). Cette methode d’apprentissage recherche le nombre de 
neurones dans la couche cachee qui produisent de bonnes qualites de predictions par optimisation 
des poids et des biais (Chau 2006; Lazzus 2009). Les quatre variantes de Palgorithme d’OEP (voir 
chapitre II) ont ete testees dans l’apprentissage du RNOEP. 

Vue le nombre limite des points experimentaux, la base de donnees (20 experiences au total) 
a ete aleatoirement repartie en deux sous-ensembles, en reservant 80 % des donnees pour la phase 
d’apprentissage et 20 % pour la phase de test. 

Afin d’optimiser 1’ architecture du RNOEP, une procedure d’essai et erreur a ete executee 
comme decrite sur la figure IV. 3. Le nombre de neurones (N) dans la couche cachee a ete varie de 2 
a 10. 


These L. Khaouane 


Page 79 


Chapitre IV. Optimisation hybride des conditions de culture de Pleurotus mutilus 



Figure IV.3. Procedure de developpement du RNOEP et du RNRB. 
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IV.3. 2.1. Comparaison avec le reseau de neurones forme avec I’algorithme de regularisation 
bayesienne (RNRB) 

A titre de comparaison, un autre RNFF forme avec Falgorithme de retro-propagation de type 
regularisation bayesienne (trainbr en code MATLAB) a ete egalement utilise pour decrire la relation 
entre le rendement en pleuromutiline avec la vitesse d’ agitation, la temperature et le pH initial (ce 
reseau est note RNRB). L’algorithme de regularisation bayesienne, qui s’est averer tres performant 
dans le troisieme chapitre de cette these de doctorat, trouve de nombreuses applications dans 
l’apprentissage des RN utilises a des fins d’optimisation (Rosa et al. 2010; Lu et al. 2011). 

Le RNRB possede une structure similaire a celle du RNOEP (une couche d'entree avec trois 
nceuds representant les facteurs etudies, une seule couche cachee et une couche de sortie avec un 
neurone generant la valeur estimee du rendement en pleuromutiline). La procedure utilisee pour 
optimiser l’architecture du RNRB est decrite sur la figure IV.3. 


IV. 3.2.2. Comparaison avec la methodologie de surface de reponse (MSR) 

En vertu de la MSR, la relation entre les variables selectionnees s'exprime 
mathematiquement sous la forme d'une equation polynomial du second degre : 

r(m/g)=Po + + YfiX + Y.h x < x , (ivj) 


Ou Y est la variable de reponse predite ; f3 0 est une constante representant l’effet moyen general ; fa 
sont les coefficients de regression lineaire ; /A sont les coefficients de regression quadratique et /i /y - 
sont les coefficients de regression associes aux termes d'interaction ; Xj qXXj (z = 1, 2, 3 ; j = 1, 2, 3) 
represented les variables independantes sous forme de valeurs codees. 

IV.3. 2. 3. Evaluation des performances de prediction des modeles 

Afin d'evaluer faptitude et la precision de prediction des modeles neuronaux (RNOEP et 
RNRB) et du modele polynomial, la racine de Ferreur quadratique moyenne ( REQM ), Ferreur 
standard de prediction (ESP) et ferreur de prediction du modele (EPM) sont utilisees en parallele 
avec le facteur de biais (Bj) et le facteur de precision (Ay) (Kumar et al. 2011; Lu et al. 2011; Zafar 
et al 2012a; Zafar et al 2012b). 



(IV.4) 
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ESR%)= 


REQM 


K 


xioo 


EPAi%)= 






(IV.5) 

(IV.6) 

(IV.7) 

(IV.8) 


Ou Yi >exp est la valeur experimentale ; Y Upre d represente la valeur predite ; Y e est la moyenne des 
donnees experimentales ; n est le nombre d’experiences. 


IV.3.3. Optimisation par essaim de particules 

Une fonction generique de ralgorithme d’OEP (PSO en code MATLAB), recemment 
developpee pour MATLAB par Ebbesen, Kiwitz et Guzzella (Ebbesen et al. 2011), a ete utilisee 
pour optimiser Tespace d'entree du modele neuronal en vue d’obtenir une production maximale en 
sortie. 


IV.4. Logiciels utilises 

Le logiciel statistique Modde 5,0 (Umetrics) a ete utilise dans la conception de la matrice 
experimentale du plan composite centre (PCC), la modelisation des donnees experimentales par le 
polynome quadratique et l'analyse des donnees. 

La sixieme version du logiciel MATLAB et le toolbox de Talgorithme d’OEP ont ete 
utilises pour la conception et l’apprentissage des modeles neuronaux. 

La fonction generique PSO (Ebbesen et al 2011) et la septieme version de MATLAB ont 
ete utilises dans la tache d’optimisation. 
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IV.5. Resultats et discussion 

IV.5.1. Moderation par le RNOEP 

Un modele neuronal forme avec 1’algorithme d’OEP a ete construit pour modeliser la 
relation entre le rendement en pleuromutiline et les trois conditions de culture de Pleurotus mutilus 
(vitesse d'agitation, temperature et pH initial). 

L'architecture optimale obtenue du RNOEP a une topologie de 3-4-1 (Tableau IV.5) : trois 
neurones dans la couche d'entree (vitesse d'agitation, temperature et pH initial), quatre neurones 
dans la couche cachee et un neurone dans la couche de sortie (rendement en pleuromutiline). La 
variante du facteur de constriction de 1’ algorithm e d’OEP utilises dans la phase d'apprentissage s’est 
avere la plus performante par rapport aux autres variantes. Les parametres de controles de cette 
variante ont ete obtenus par essai et erreur et sont regroupes dans le tableau IV.6. L’equation 
extraite de ce modele neuronal optimise (Figure IV.4) est comme suit : 






(IV.9) 


Avec : 


r 

200 tr/min <Xj <280 tr/min 


< 25°C <X 2 <29°C 


4 <X 3 <8 

V 


Ou Wjj represente le poids synaptique de la connexion du neurone i de la couche d’entree au 
neurone j de la couche cachee ; w[ l j represente le poids synaptique de la connexion du neurone j de 

la couche cachee au neurone de la couche de sortie ; b l ! et /^represented respectivement les biais 

du neurone j de la couche cachee et du neurone de la couche de sortie. Les poids et les biais du 
RNOEP optimise sont regroupes dans le tableau IV.7. 
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Tableau IV.5. Structure des reseaux de neurones optimises (RNOEP et RNRB). 


Type 

du 

reseau 

Algorithme 

d’apprentissage 

Couche 

d’entree 

Couche cachee 

Couche de sortie 

Nombre 

de 

neurones 

Nombre 

de 

neurones 

Fonction 

d’activation 

Nombre 

de 

neurones 

Fonction 

d’activation 

RNOEP 

trainpso 

3 

4 

tansig 

i 

purelin 

RNRB 

trainbr 

3 

8 

tansig 

i 

purelin 


Tableau IV.6. Parametres de commande utilises pour l'execution de la variante du facteur de 
constriction de Palgorithme d’OEP lors de l’apprentissage du RNOEP. 


Parametre 

Valeur 

Nombre de population 

50 

Nombre de generations 

2000 

Facteurs d'apprentissage 

1.3 

Poids d'inertie 

0.6 et 0.9 

Cl 

2.05 

C2 

2.05 


Tableau IV.7. Poids et biais du RNOEP optimal. 


Connexions 

Couche d’entree-Couche cachee 

Connexions 
Couche cachee- 
Couche de sortie 


Poids 


Biais 

Poids 

Biais 

w n 

W j 2 


*! 

< 

* 

0.4932 

-0.7624 

5.1285 

-2.1210 

-0.4951 


42.9328 

0.1389 

39.4624 

0.3183 

0.3582 

-0.3097 

12.0855 

42.3870 

-29.8827 

-0.1253 

-0.3545 


0.2405 

-72.8371 

-83.5661 

-5.4771 

-0.4730 
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Figure IV.4. Representation schematique du modele neuronal (RNOEP ou RNRB). 


On a procede a une analyse de sensibilise du RNOEP optimal par la methode de "Poids" et 
la methode de "Profil" (voir la section III.2.4 du chapitre III pour plus de detail). La figure IV.5 
donne une presentation des % de l’importance relative (Jr), obtenue par la methode de "Poids", de 
chaque variable d’entree du RNOEP sur le rendement. D’apres cette figure, le pH initial de la 
fermentation a la contribution la plus importante suivie de la temperature. La vitesse d’ agitation 
possede le % de Ylr le plus faible par rapport aux deux autres variables, mais sa contribution est 
aussi importante que les deux autres (% de l’lr > 5%). 

La figure IV. 6 illustre les graphes du profil de contribution des variables d’ entrees simulees 
sur le rendement (7) predit par le RNOEP optimal, on constate que : 


• Les valeurs des vitesses d’agitations comprises entre 200 et 243 tr/min ont peu d’effet 
sur le rendement, entre 243 et 250 tr/min on observe une augmentation de 7, alors 
qu’au dela de 250 tr/min, le rendement diminue. On peut dire que la zone optimale se 
situe entre 243 et 250 tr/min (Figure IV. 6 (a)). 

• Plus la temperature augmente, plus le Y predit par le RNOEP augmente jusqu’a la 
temperature de 27.5°C ; au dela de cette valeur, le rendement diminue puis devient peu 
influent (constant). On conclue que la zone optimale de temperature se situe entre 27 et 
27.5°C (Figure IV.6 (b)). 

• Le pH initial est le facteur le plus influent sur le rendement, plus le pH augmente plus 
le Y predit par le RNOEP augmente jusqu’au pH de 6.2 ; au dela de cette valeur le 
rendement diminue. La zone optimale du pH se situe entre 6 et 6.5 (Figure IV.6 (c)). 


Les contributions relatives de chaque variable d’entree, obtenues par la methode de profil, 
ont ete exprimees par les valeurs de l’intervalle (maximum-minimum) de leurs contributions 
(Figure IV.5). On constate que les % de contributions relatives de chaque variable depasse les 5%, 
montrant ainsi V importance des trois variables sur les sorties du RNOEP. Cette analyse de 
sensibilite par les deux methodes utilisees montre a posteriori V importance des trois conditions de 
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culture choisies pour la modelisation du rendement de production de pleuromutiline et constituent 
par consequent une justification du choix postule anterieurement. 



Methode de "Poids" 


y Vitesse d'agitation ■ Temperature a pH 


Methode de "Profil" 



y Vitesse d'agitation u Temperature MpH 


Figure IV.5. Presentation des % de Pimportance relative (/r) (obtenus par la methode de 
’’poids") et des % de contribution relative (obtenus par la methode de "profil") de chaque variable 

d’ entree du RNOEP sur le rendement. 



(a) (b) 
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pH 


(c) 


Figure IV.6. Graphes du profil de contributions des variables simulees (Vitesse d’agitation, 
temperature, ^//initial) sur le rendement predit par le RNOEP : (a) effet de la vitesse d’agitation, 

(b) effet de la temperature, (c) effet du pH initial. 


IV.5.2. Moderation par le RNRB 

La topologie optimale obtenue du RNRB est de 3-8-1 (Tableau IV.5) : trois neurones dans la 
couche d'entree, huit neurones dans la couche cachee et un neurone dans la couche de sortie. 
L’equation extraite de ce modele neuronal (RNRB) optimise est comme suit : 



(IV.10) 


Avec : 


200 tr/min <Xj <280 tr/min 



25°C <X 2 <29°C 


4 <X 3 <8 

V 

Ou wb represente le poids synaptique de la connexion du neurone i de la couche d’entree au 
neurone j de la couche cachee ; w[ I j represente le poids synaptique de la connexion du neurone j de 

la couche cachee au neurone de la couche de sortie ; b 1 - et b° represented respectivement les biais 
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du neurone j de la couche cachee et du neurone de la couche de sortie. La matrice des poids et biais 
du RNRB optimise est presentee dans le tableau IV.8. 


Tableau IV.8. Poids et biais du RNRB optimal. 


Connexions 

Couche d’entree-Couche cachee 

Connexions 
Couche cachee- 
Couche de sortie 


Poids 


Biais 

Poids 

Biais 

K 

W J2 

W j3 


< 


0.3404 

-0.0496 

2.1947 

-0.5848 

-1.4658 


-0.0267 

0.0309 

0.0930 

-0.2332 

0.2652 


-0.0267 

0.0309 

0.0930 

-0.2329 

0.2649 


-0.0114 

-0.8538 

-0.7748 

-0.4143 

-0.8710 

-0.9691 

1.2162 

0.5303 

0.5769 

0.0664 

1.0575 


0.1717 

1.5359 

-0.0385 

-0.5000 

-0.9831 


-0.4016 

-0.0915 

1.3834 

0.2917 

1.0807 


-0.0267 

0.0309 

0.0930 

-0.2330 

0.2650 



On a procede a une analyse de sensibilise du RNRB optimal par la methode de "Poids” et la 
methode de "Profil" (voir chapitre III pour plus de detail). La figure IV.7 donne une presentation 
des % de P importance relative (Jr), obtenue par la methode de "Poids", de chaque variable d’entree 
du RNRB sur le rendement. D’apres cette figure le pH initial de la fermentation a la contribution la 
plus importante, suivie de la temperature. La vitesse d’agitation possede le % de VIr le plus faible 
par rapport au deux autres variables, mais sa contribution est aussi importante que les deux autres. 

La figure IV.8 illustre les graphes du profil de contribution des variables d’entrees simulees 
sur le rendement (F) predit par le RNRB optimal, on constate que : 

• Les valeurs des vitesses d’agitations comprise entre 200 et 230 tr/min ont peu d’effet 
sur le rendement, entre 230 et 250 tr/min on observe une augmentation de 7, alors 
qu’au dela de 250 tr/min, le rendement predit par le RNRB diminue. On peut dire que 
la zone optimale se situe entre 240 et 250 tr/min (Figure IV.8 (a)). 

• Plus la temperature augmente, plus le Y predit par le RNRB augmente jusqu’a la 
temperature de 26.5°C ; au dela de cette valeur, le rendement diminue. On conclue que 
la zone optimale de temperature se situe entre 26 et 27 °C (Figure IV.8 (b)). 
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• Le pH initial est le facteur le plus influent sur le rendement, plus le pH augmente plus 
le Y predit par le RNRB augmente jusqu’au pH de 6.2 ; au dela de cette valeur le 
rendement diminue. La zone optimale du pH initial se situe entre 6 et 6.2 (Figure IV. 8 

(c)). 

Les contributions relatives de chaque variable d’entree, obtenues par la methode de "pro fir, 
ont ete exprimees par les valeurs de l’intervalle (maximum-minimum) de leurs contributions 
(Figure IV.7). On constate que les % de contributions relatives de chaque variable depasse les 5%, 
montrant ainsi l’importance des trois variables sur les sorties du RNRB. Cette analyse de sensibilite 
par les deux methodes utilisees montre a posteriori l’importance des trois conditions de culture 
choisies pour la modelisation du rendement de production de pleuromutiline et constituent par 
consequent une justification du choix postule anterieurement. 


Methode de "Poids" 



y Vitesse d'agitation ■ Temperature UpH 


Methode de "Profil" 



y Vitesse d'agitation u Temperature M pH 


Figure IV.7. Presentation des % de Fimportance relative (Jr) (obtenus par la methode de "poids") et 
des % de contribution relative (obtenus par la methode de "profil") de chaque variable d’entree du 

RNRB sur le rendement. 
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(a) (b) 



pH 


(c) 


Figure IV.8. Graphes du profil de contributions des variables simulees (Vitesse d’agitation, 
Temperature, ^//initial) sur le rendement predit par le RNRB: (a) effet de la vitesse d’agitation, (b) 

effet de la temperature, (c) effet du />// initial. 


IV.5.3. Moderation par la MSR 

Le modele polynomial quadratique obtenu sous la MSR (Equation IV. 1 1) a donne lieu a un 
mauvais ajustement (les coefficients de regression globale ( R ) et ajuste ( R a juste) ont des valeurs tres 
faibles de l’ordre de 0.765 et de 0.554). 

Y(ng/g) = 7773.73 + 469.188 X, + 38.8124 X 2 + 824.562 X 3 - 318.511 Xi 2 - 718.511 X 2 2 - 1273.51 
X 3 2 - 88.875 X,X 2 - 197.376 X,X 3 - 237.625 X 2 X 3 (IV.ll) 
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L’estimation des divers parametres inconnus du modele (Tableau IV.9) revele que seuls trois 
coefficients du modele polynomial sont juges significatifs (P - value <0.05) : l’effet lineaire du pH q t 
l'effet quadratique de la temperature et du pH. Ces resultats sont juges acceptables tant que la valeur 

7 #7 

de R ajuste est plus petite que R , le modele contient plusieurs termes et la taille de fechantillon est 
faible. L'utilisation d’un R ajus te est une tentative de prendre en compte le phenomene de 
retrecissement statistique, la tendance des modeles, a moins bien reussir, hors echantillon, que dans 
fechantillon. Le R ajuste est une modification en raison de R qui ajuste le nombre de termes 
explicatifs dans un modele par rapport au nombre de points de donnees. 

Les effets d’interaction entre deux parametre tout en gardant le troisieme constant (a son 
niveau central) sont representes par des traces de surfaces de reponses et de contours (Figure IV.9). 
Ces representations graphiques sont issues du modele de T equation IV.ll. II a ete note que le 
rendement augmente avec Taugmentation de la vitesse d’agitation, de la temperature et du pH. La 
zone du rendement maximal se situe dans les intervalles suivants : Temperature (°C) = [25.5-28] ; 
Vitesse d’agitation (tr/min) = [240-280] et pH= [5. 5-7. 5]. 

Tableau IV.9. Coefficients du modele estime par analyse de regression lineaire multiple. 


Sources 

Coeff. SC 

Std. Err. 

P-value 

Moyenne / intercepts 

7773.73 

547.267 

5.90 10' Xa 

x, 

469.188 

343.018 

0.2013 

x 2 

38.8124 

343.018 

0.9122 

x 3 

824.562 

343.017 

0.0371 a 

xj 

-318.511 

273.633 

0.2714 

Xf 

-718.511 

273.633 

0.0253 a 

Xs 2 

-1273.51 

273.633 

0.0009 a 

x,x 2 

-88.875 

485.1 

0.8583 

X 1 X 3 

-197.376 

485.1 

0.6927 

x 2 x 3 

-237.625 

485.1 

0.6348 


a Termes significatifs (T- value < 0.05) 
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Temperature (°C) 


(c) 

Figure IV.9. Traces de surfaces de reponses et de contours de la MSR : (a) effet de la temperature 
et de la vitesse d’agitation, (b) effet du pH initial et de la vitesse d’agitation, (c) effet du />// initial 

et de la temperature. 
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IV.5.4. Comparaison des modeles predictifs 

II nous a fallu 7 mois pour la realisation des 20 experiences batch et la programmation des 
RN en MATLAB. L’execution des programmes est realisee dans l’interface Windows 7 et 
Windows XP avec 32 bits et une RAM de 2 GB, le temps d’execution des programmes est illustre 
sur le tableau IV. 10. 


Tableau IV.10. Temps d’execution. 


RN 

Temps d’execution (s) 
du programme du RN 

Temps d’execution (s) 
de simulation du RNO 

RNOEP 

1.4943 10 4 

0.0359 

RNRB 

993.4002 

0.0386 


Les valeurs de predictions des trois modeles (MSR, RNOEP et RNRB) sont illustrees dans 
le tableau IV.ll. La figure IV. 10 montre une comparaison entre les valeurs experimentales et 
calculees par les modeles neuronaux (RNRB et RNOEP) et le modele polynomial de la MSR, pour 
la totalite de 1’ ensemble de donnees. Comme on peut le constater, les modeles neuronaux (RNRB et 
RNOEP) s’ajustent avec une excellente precision aux donnees experimentales. Le tableau IV. 12 
rassemble les vecteurs de regression lineaire pour les trois modeles, ce tableau montre que les 
parametres de regression les moins favorables sont ceux obtenus par le modele polynomiale de la 
MSR. 


II est de pratique courante d'utiliser le coefficient de correlation ( R ) pour comparer differents 
modeles statistiques (Buchanan et Bagi 1 994), mais avec le modele de regression non lineaire, ce 
terme doit etre utilise avec prudence (Ratkowsky 1990; Panagou et Kodogiannis 2009). Done, 
d'autres indices statistiques ( REQM , ESP, EPM, ByetAf) sont ajoutes pour la comparaison (Figure 
IV.ll etTableauIV.il). 

Comme le montre le tableau IV.ll, le modele de la MSR donne les plus grandes valeurs des 
erreurs par rapport aux modeles neuronaux : la REQM est de 970.3 pg/g et YESP est de 16.38 %. 
En comparant les deux modeles neuronaux, on constate que la REQM et YESP pour le RNOEP 
(149.94 pg/g et 2.53 %) sont legerement inferieurs a ceux du RNRB (154.95 pg/g et 2.62 %). Ces 
resultats montrent que le modele neuronal (RNOEP ou RNRB) possede une capacite de 
modelisation elevee par rapport au modele polynomial de la MSR. 
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Figure IV.10. Comparaison entre les valeurs experimentales et calculees par les modeles (MSR, 

RNRB et RNOEP) pour la totalite de l’ensemble de donnees. 


Le facteur de biais Bf du modele polynomial de la MSR qui est de 1.03 (superieur a un et 
inferieur a 1,1) indique que ce modele echoue dangereusement ("fail-dangerous" en anglais). Les 
facteurs de biais Bf du RNOEP et du RNRB, qui sont de 0.98 pour les deux, indiquent que ces 
modeles sont des modeles a surete ("fail-safe" en anglais). 

Le facteur de precision Af est beaucoup plus proche de funite pour les deux modeles 
neuronaux (RNOEP et RNRB) que pour le modele de la MSR, montrant ainsi une bonne 
concordance entre les valeurs observees et les valeurs predites par les modeles neuronaux. 

Des erreurs de prediction ( EPM) d’environ 2.73 %, 2.7 % et 14.25 % sont respectivement 
observees pour le RNRB, le RNOEP et le modele de la MSR, indiquant la superiorite des modeles 
neuronaux. 

La superiorite de l’aptitude de prediction et de la precision de prediction d’un modele 
neuronal est due a sa capacite universelle d’approximer des systemes non-lineaires de bien 
meilleure fagon, en particulier pour les processus biologiques, alors que le modele de la MSR est 
limite a une equation polynomial du second degre. Des observations semblables ont ete faites sur 
les donnees de quelques articles sur la MSR (Andersson et Adlercreutz 1999; Beg et al. 2002; Singh 
et al. 2009; Gurunathan et Sahadevan 2011). Par consequent, il est fiable pour les modeles du 
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RNRB et du RNOEP d'etre employe en tant que fonctions objet ("fitness function" en anglais) dans 
l’etape de 1’ optimisation. 


Tableau IV.ll. Rendement experimental et predit par les modeles. 


Essai 

Rendement de production (pg/g) 

Experimental 

Predit par 

MSR 

RNRB 

RNOEP 

1 

3658 ±210 

3606.76 

3480.13 

3450.2 

2 

5344 ± 151 

5117.63 

5379.25 

5343.3 

3 

3078 ± 150 

4337.38 

3024.59 

2928.1 

4 

5735 ± 370 

5492.76 

5320.02 

5359.4 

5 

4383 ±240 

6125.88 

4422.99 

4382.7 

6 

6606 ±21 

6847.26 

6596.53 

6626 

7 

4179 ± 100 

5906.01 

4321.80 

4278.7 

8 

4720 ± 560 

6271.88 

4749.64 

4719.7 

9 

7150 ±150 

5561.3 

7219.07 

7298.7 

10 

7350 ± 150 

7438.05 

7218.42 

7200.2 

11 

4925 ± 175 

4822.06 

4929.26 

4924.8 

12 

6375 ± 125 

4977.31 

6498.32 

6499.7 

13 

650 ±98 

1030.56 

546.73 

550.8 

14 

6210 ± 192 

4328.81 

6201.23 

6210.3 

15 

8186 ±548 

7773.73 

7884.66 

7910 

16 

7899 ±34 

7773.73 

7884.66 

7910 

17 

7897 ± 420 

7773.73 

7884.66 

7910 

18 

8111 ±295 

7773.73 

7884.66 

7910 

19 

8125 ± 125 

7773.73 

7884.66 

7910 

20 

7925 ± 175 

7773.73 

7884.66 

7910 

REQM (fig/g) 


970.30 

154.95 

149.94 

ESP (%) 


16.38 

2.62 

2.53 

EPM (%) 


14.25 

2.73 

2.7 

Bf 


1.03 

0.98 

0.98 

A f 


1.16 

1.03 

1.03 
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Tableau IV.12. Vecteurs de regression lineaire issue de l’equation lineairej; ca/ = ay exp +/?, [a 

(pente), /? (ordonnee a l’origine), R (coefficient de correlation)]. 



Totalite de la base 

a 

MSR 

0.765 

RNOEP 

0.998 

RNRB 

0.9864 

p 

MSR 

1392.3 

RNOEP 

-51.812 

RNRB 

15.867 

R 

MSR 

0. 8746 

RNOEP 

0.9977 

RNRB 

0.9975 



(a) 
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Figure IV.ll. Comparaison entre les modeles : (a) en termes de la REQM \ (b) en termes des % 

d’erreurs ( ESP et EPM ), (c) en termes des facteurs Af et Bf. 
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IV.5.5. Optimisation des modeles neuronaux 

Vu que le RNOEP a donne des resultats legerement meilleurs que ceux du RNRB, alors les 
deux equations extraites de ces deux modeles neuronaux (Equation IV.9 et Equation IV. 10) ont ete 
utilisees comme des fonctions objets dans la tache d'optimisation. 

L'algorithme generique d’OEP (PSO en code MATLAB) a ete utilise pour optimiser Tespace 
d'entree (c.-a-d., les conditions de culture) pour chaque modele neuronal en vue d’obtenir une sortie 
maximale (c.-a-d., un rendement de production maximal). 

Un nombre de particules entre 30 et 100 a ete etudie et aucune difference n'a ete observee 
dans la recherche du rendement optimal. Le nombre de particules et les coefficients d’ acceleration 
ci et C 2 sont respectivement de 50, 1.5 et 1.5. Le poids d'inertie debute avec une valeur elevee de 0,9 
et decroit lineairement a 0,4 quand le nombre de generations atteint 50. 

Les figures IV. 12 et IV. 13 illustrent respectivement le profil de convergence des taches de 
resolution de foptimisation du RNRB et du RNOEP avec falgorithme d’OEP. Pour la methodologie 
M RNRB-OEP M (Figure IV. 12), lorsque le nombre de generations atteint 12, les conditions optimales 
sont trouvees et la convergence est tres rapide. Lorsque le nombre de generations atteint 28, toutes 
les particules convergent vers la meilleure solution trouvee. Pour la methodologie M RNOEP-OEP M 
(Figure IV. 13) lorsque le nombre de generations atteint 17, les conditions optimales sont trouvees et 
la convergence est moins rapide que celle du M RNRB-OEP M . Lorsque le nombre de generations 
atteint 26, toutes les particules convergent vers la meilleure solution trouvee. 

L'approche M RNRB-OEP M predit une production maximale de 8270 pg/g a une vitesse 
d’agitation de 258 tr/min, un niveau de temperature de 26.78 °C et un pH initial de 5.98. Sous 
l’approche M RNOEP-OEP M , un rendement maximal en pleuromutiline de 10149 pg/g a ete predit a 
une vitesse d'agitation de 242 tr/min, une temperature de 26.88 °C et un pH initial de 6.06. On 
constate que la methodologie M RNOEP-OEP M predit une reponse plus elevee avec differentes 
conditions de culture que celle predites par la methodologie M RNRB-OEP M . Le niveau optimal de la 
vitesse d'agitation predit par "RNOEP-OEP" (242 tr/min) est plus faible que celui predit par 
"RNRB-OEP" (258 tr/min). Le niveau de temperature optimal estime par "RNOEP-OEP" est proche 
de celui estime par "RNRB-OEP". Le pH optimal predit par "RNOEP-OEP" (6.06) est proche de 
celui predit par "RNRB-OEP" (5.98). Comme indique dans le tableau IV.13, la validation des 
reponses predites montre que la methode "RNOEP-OEP" possede la meilleure precision et aptitude 
de prediction. 
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Le tableau IV. 13 et la figure IV. 14 montrent que l’approche M RNOEP-OEP M donne un 
rendement de 27.5 % superieur a celui obtenu par M RNRB-OEP M . Le rendement en pleuromutiline 
predit par M RNOEP-OEP M egalement s’ajuste a celui observe dans les niveaux optimaux beaucoup 
mieux que dans le cas de M RNRB-OEP M (Tableau IV. 13). 

Ces resultats indiquent que, meme si la vitesse d'agitation optimisee par M RNRB-OEP M etait 
superieure a celle optimisee par M RNOEP-OEP M , ce qui pourrait fournir une plus grande quantite 
d'oxygene dissous dans le bouillon de culture et pourrait renforcer la production d'antibiotiques, 
mais en raison des forces et des contraintes de cisaillement elevees, ainsi qu’une abrasion plus 
importante, la production de pleuromutiline a diminue. 

Les resultats de cette etude ont montre que la capacite d’ estimation de fapproche hybride 
M RNOEP-OEP M dans les niveaux optimaux de variables etait plus precise que l’approche "RNRB- 
OEP". Ceci pourrait etre attribue au fait que Talgorithme d’apprentissage de regularisation 
bayesienne (trainbr) presente finconvenient de rester coincee a un minimum local, alors que 
falgorithme d’apprentissage d’OEP (trainpso), peut rechercher un optimum global en mettant a jour 
les generations (Zhang et al. 2007). A notre connaissance, il n ? y a eu aucun rapport sur 
foptimisation des bioprocedes par la methodologie M RNOEP-OEP M . 



Figure IV.12. Evolutions de la fonction de fitness meilleure et moyenne au cours de la 

methodologie "RNRB-OEP". 
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Figure IV.13. Evolutions de la fonction de fitness meilleure et moyenne au cours de la 

methodologie hybride M RNOEP-OEP M . 


Tableau IV.13. Resultats de V optimisation. 



Conditions de 

Reponse 

Reponse 

EPM 

(%) 

Methodologie 


culture 

predite 

experimentale 


XI 

X2 

X3 

(^g/g) 

(jLlg/g) 

RNRB-OEP 

258 

26.78 

5.98 

8270 

7900 ± 200 

4.68% 

RNOEP-OEP 

242 

26.88 

6.06 

10149 

10074 ±500 

0.73% 
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Figure IV.14. Comparaison entre les deux methodologies (RNOEP-OEP et RNRB-OEP) : 
(a) en termes de rendement predit et experimental, (b) en termes de YEPM. 
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IV.6. Comparaison indirecte avec d’autres methodologies d’optimisation a base 
des RN 

Nous avons opte pour une comparaison indirect de fourchette de la methodologie hybride 
proposee dans ce chapitre (RNOEP-OEP) avec d’autres methodologies d’optimisation a base des 
RN les plus utilises en bioprocedes et plus particulierement l’optimisation des procedes de 
fermentation. Le tableau IV. 14 donne une description de ces differentes methodologies 
d’optimisation et le tableau IV. 15 donne une comparaison des resultats de ces methodologies 
d’optimisation en termes des erreurs ob tenues lors des phases de modelisation et d’optimisation. 
Pour encore mieux illustrer cette comparaison nous avons presente ces resultats sous formes de 
deux histogrammes, un illustrant les erreurs ob tenues lors des phases de modelisation (Figure 
IV. 15) et un autre representant les erreurs obtenues lors des phases d’optimisation (Figure IV. 16). 
Pour les methodologies qui font appel a l’algorithme d’OEP (RN-OEP), notre modele neuronale 
(Khaouane et al 2012a) donne une ESP et une EPM plus elevees que les modeles de (Huang et al 
2007) et de (Liu et al 2009) (Figure IV. 15), d’ou son optimisation a egalement donne une erreur 
plus elevee que les deux autres (Figure IV. 16). Pour les methodologies qui font appel a l’algorithme 
genetique (RN-AG), le modele neuronale de (Singh et al 2009) donne le % d’erreur le plus faible 
par rapport aux deux modeles de Zafar (Zafar et al 2012a; Zafar et al 2012b) (Figures IV. 15), d’ou 
son optimisation a egalement donne une erreur plus faible (Figure IV. 16). Ces resultats prouvent 
que la performance de l’optimisation des equations mathematiques issues des modeles neuronaux 
est strictement liee a la capacite de prediction et de generalisation de ces derniers. En effet, plus le 
modele neuronal est performant plus son optimisation donne des resultats plus precis. 

La figure IV. 16 indique aussi que 1’optimisation par l’algorithme d’OEP est plus 
performante que l’optimisation par l’AG avec des erreurs inferieures a 1%. On peut dire que 
l’algorithme d’OEP constitue une alternative interessante a l’algorithme genetique dans 
l’optimisation des modeles neuronaux, c’est ce qui justifie notre choix de l’utiliser au cours de la 
phase d’optimisation dans la methodologie hybride proposee dans ce chapitre. Cependant, 
l’inconvenient majeur qui accompagne l’utilisation de l’algorithme d’OEP est le reglage des ses 
parametres qui s’avere plus de Part que de la science. 
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Tableau IV.14. Description de differentes methodologies d’ optimisation a base des RN dans la litterature. 


Reference 

Produit 

Souche 

Variables 

independantes 

Variables 

dependantes 

Methodologie d’ optimisation a base des RN 

plan 

d’ experience 

Reseau de 
neurones 

Algorithme 
d’ optimisation 

Notation 

(Huang et al. 2007) 

Acide- Gamma- 
Aminobutyrique 
(GABA) 

Lactobacillus 

brevis 

(catalyseur) 

pH , Temperature et 
FeS0 4 . 7H20 

Rendement de 
GABA 

Plan Composite 
Centre (PCC) 

RNFF 

Algorithme d’ optimisation 
par ess aim de parti cules 
(OEP) 

RN-OEP 

(Liu et al 2009) 

Acide hyaluronique 

Streptococcus 

zooepidemicus 

Vitesse d’ agitation, taux 
d’ aeration et le nombre 
d’ agitate ur 

Rendement de 
production 

Box-behnken 

Reseau a 
fonction 
radiale 
(RFR) 

Algorithme d’ optimisation 
par ess aim de parti cules 
(OEP) 

RN-OEP 

Notre result at 

Pleuromutiline 

Pleurotus 

mutilus 

Vitesse d’ agitation, 
Temperature et PH 

Rendement en 
produit 

Plan Composite 
Centre (PCC) 

RNFF 

Algorithme d’ optimisation 
par ess aim de parti cules 
(OEP) 

RNOEP-OEP 

(Singh et al. 2009) 

Actinomycine V 

Streptomyces 

triostinicus 

MgS04, NaCl, glucose, 
la farine de soja et 
CaC0 3 

Rendement de 
Tantibiotique 

Plan Composite 
Centre (PCC) 

RNFF 

Algorithme genetique 
(AG) 

RN-AG 

(Zafar et al. 2012a) 

Poly (3- 

hydroxybutyrate-co- 
3 -hydr oxyvalerate) 

Azohydromonas 
lata MTCC 
2311 

Can molases, uree et 
acide propionique 

Biomasse et 
produit 

Box-behnken 

RNFF 

Algorithme genetique 
(AG) 

RN-AG 

(Zafar et al. 2012b) 

Polyhydroxybutyrate 

Azohydromonas 
lata MTCC 
2311 

Le saccharose, l'uree et 
la solution de TE 

Biomasse et 
Produit 

Plan Composite 
Centre (PCC) 

RNFF 

Algorithme genetique 
(AG) 

RN-AG 
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Tableau IV.15. Comparaison des resultats des differentes methodologies d’ optimisation a base des 

RN dans la litterature. 


Reference 

Notation 

Dimension 
de la base 
de donnees 

Architecture 

Phase de 
modelisation 
neuronale 

Phase 

d’optimisation 

ESP 

(%) 

EPM 

(%) 

ESP (%) = 
EPM (%) 

(Huang et al. 2007) 

RN-OEP 

21 

RNFF : 3-4-1 

0.08 

0.05 

0.47 

(Liu et al 2009) 

RN-OEP 

20 

RFR : 3-1 

2.04 

1.96 

0.72 

Notre resultat 

RNOEP-OEP 

20 

RNFF : 3-4-1 

2.53 

2.7 

0.73 

(Singh et ah 2009) 

RN-AG 

36 

RNFF : 5-5-1 

2.59 

1.21 

2.03 

(Zafar et aL 2012a) 

RN-AG 

17 

RNFF : 3-4-1 

5.31 

1.74 

2.08 

(Zafar et al. 2012b) 

RN-AG 

20 

RNFF : 3-4-4 

2.84 

2.14 

2.59 



Notre resultat 
(Liu et al. 2009) 
(Huong et al. 2007) 
(Zoforet al. 2012b) 
(Zafaret al. 2012a) 

(Singh et al. 2009) 


RN-AG 


RN-OEP 


y (Singh et al. 2009) U (Zafar et al. 2012a) fci (Zafar et al. 2012b) 
H (Huang et al. 2007) id (Liu et al. 2009) id Notre resultat 


Figure IV.15. Comparaison, en termes des % d’erreurs (ESP et EPM) de la phase de modelisation, 
de differentes methodologies d’optimisation a base des RN dans la litterature. 
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2.59 



resultat 


-RN-AG URN-OEP 


Figure IV.16. Comparaison, en termes de V E PM de la phase d’ optimisation, des differentes 

methodologies d’ optimisation a base des RN dans la litterature. 


IV.7. Conclusion 


Dans ce chapitre on a developpe une methodologie hybride, incluant un plan composite 
centre (PCC), un reseau de neurones artificiel (RN) et un algorithme d'optimisation par essaim de 
particules (OEP) et ceux afin d’optimise les conditions de culture de Pleurotus mutilus (vitesse 
d'agitation, temperature et pH initial). Le PCC et le RN ont ete utilises respectivement pour la 
planification des experiences et la modelisation du processus de fermentation. L’algorithme d’OEP 
a ete utilise pour deux fins : le remplacement de la retro-propagation standard dans l’apprentissage 
du RN (RNOEP) et foptimisation du processus (RNOEP-OEP). 

En vertu de cette approche hybride (RNOEP-OEP), les niveaux optimaux des conditions de 
culture sont : une vitesse d'agitation de 242 tr/min, une temperature de 26,88 °C et un pH de 6.06. 
Une production de 10074 ± 500 pg/g qui est en tres bon accord avec la prediction (10149 pg/g), a 
ete observee dans fexperience de verification. 


La combinaison du RNOEP avec l’algorithme generique d’OEP a une bonne previsibilite et 
une bonne precision dans foptimisation du bio-processus. Cette approche hybride est suffisamment 
generate et peut ainsi etre tres utile pour modeliser et optimiser d’autres bioprocedes industriels. 





Conclusion generate 
et perspectives 



Conclusion generate et perspectives 


Les reseaux de neurones possedent une propriety remarquable dont l’apport est manifesto 
pour la moderation des processus non lineaires : ce sont des approximateurs universels 
parcimonieux. Les precedes biologiques se differencient des autres precedes par la variability de 
leur comportement dynamique generee par la presence des organismes vivants. Compte tenu de la 
complexity de ces procedes, liee a leur nature non lineaire et non stationnaire, les techniques 
neuronales presentent un interet accru dans la modelisation de ces procedes. L’objectif de cette 
these visait a developper des methodologies basees sur les reseaux de neurones pour la modelisation 
de la fermentation de pleuromutiline et ceux pour un but de prevision et d’optimisation. 

Notre premiere contribution a porte sur futilisation des reseaux de neurones artificiels pour 
la modelisation de la biosynthese de pleuromutiline produite par la souche Pleurotus mutilus en 
mode fed-batch. Pour cela, trois modeles neuronaux de type feedforward sont construits et 
optimises dans le but de predire revolution des parametres difficilement mesurables on line, a 
savoir les concentrations de la biomasse, du substrat et du produit, a partir de variables facilement 
mesurables dans la fermentation fed-batch de pleuromutiline. Les trois modeles neuronaux sont 
caracterises par une structure similaire : cinq neurones dans la couche d'entree (le temps de 
fermentation, le pH , V indice de refraction, la concentration initiale d’inoculum et la concentration 
initiale en glucose), une couche cachee avec un nombre de neurones optimise au cours du processus 
d’apprentissage et un neurone dans la couche de sortie (biomasse, consommation du sucre ou 
formation du produit). Une bonne concordance, entre les valeurs experimentales et les valeurs 
predites, pour chaque modele neuronal a ete obtenue (les racines des erreurs quadratiques moyennes 
pour la base de test etaient de : 0,4624 % pour le modele decrivant la croissance cellulaire ; 0,1234 
g/L pour le modele decrivant revolution de la consommation du substrat et 0,0016 mg/g pour le 
modele decrivant la formation du produit). Par ailleurs, la comparaison entre les modeles neuronaux 
optimises et les modeles cinetiques non structures, en termes de prediction et de simulation, a 
montre la superiority des modeles neuronaux. En plus de Pexcellente correlation des donnees 
experimentales, les trois modeles neuronaux utilises ont montre une bonne capacity predictive 
d’ interpolation avec des coefficients de correlations approchant l’unite. D’autre part, l’analyse de 
sensibilite appliquee aux trois reseaux optimises a demontre 1’ importance des cinq parametres 
choisis pour modeliser la cinetique de fermentation de pleuromutiline. 

Notre deuxieme contribution s’est basee sur le developpement d’une methodologie hybride 
d’optimisation, incluant un plan composite centre (PCC), un reseau de neurones artificiel (RN) et 
un algorithme d'optimisation par essaim de particules (OEP). Cette technique a ete appliquee a 
l’optimisation des conditions de culture de Pleurotus mutilus (vitesse d'agitation, temperature et pH 
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initial) lors de la production batch de pleuromutiline et ceux dans le but d’obtenir une production 
maximale en produit. Le PCC a ete utilise pour planifier et concevoir fexperience afin d’obtenir des 
donnees experimentales statistiquement bien reparties dans le domaine d’entree, le RN a ete utilise 
pour modeliser le processus non lineaire et ainsi obtenir une fonction mathematique reliant le 
rendement en pleuromutiline avec les trois facteurs. L’algorithme d’OEP a ete utilise pour deux 
fins: le remplacement de la retro -propagation standard dans l’apprentissage du RN (RNOEP) et 
foptimisation du modele neuronal obtenu (RNOEP-OEP). La comparaison, en termes de 
modelisation, du modele neuronal forme avec Ealgorithme d’OEP (RNOEP) avec le modele 
quadratique de la methodologie des surfaces de reponse (MSR) et avec le reseau de neurones forme 
avec l’algorithme de regularisation bayesienne (RNRB), a demontre la grande capacite de 
modelisation des modeles neuronaux (RNOEP et RNRB). Par la suite, un algorithme generique 
d’OEP a ete utilise pour optimiser l’espace d’entrees des deux modeles neuronaux a savoir le 
RNOEP (RNOEP-OEP) et le RNRB (RNRB-OEP). En vertu de l’approche hybride "RNOEP- 
OEP”, les niveaux optimaux des conditions de culture obtenues sont : 242 tr/min pour la vitesse 
d'agitation, une temperature de 26,88 °C et un pH de 6.06. Une production de 10074 ± 500 pg/g qui 
est en tres bon accord avec la prediction (10149 pg/g), a ete observee dans fexperience de 
verification. L’approche "RNRB-OEP" predit une production maximale de 8270 pg/g a une vitesse 
d’agitation de 258 tr/min, un niveau de temperature de 26.78 °C et un pH initial de 5.98. Sous ces 
conditions, une production de 7900 pg/g a ete obtenue dans l’experience de validation. L’approche 
hybride "RNOEP-OEP" (10074 pg/g) a donne un rendement de 27,5 % superieur a celui obtenu par 
l’approche "RNRB-OEP" (7900 pg/g) demontrant ainsi la superiorite de la methodologie hybride 
proposee. 

A la lumiere des resultats obtenus on peut tirer les conclusions suivantes : 

• Les reseaux de neurones sont des outils statistiques, qui permettent d'ajuster des fonctions 
non lineaires tres generates a des ensembles de points comme toute methode statistique ; 

• Les reseaux de neurones fonctionnent comme une boite noire et les parametres du reseau 
(poids et biais) n’ont pas de signification physique. L’application des reseaux neuronaux 
ne developpe pas directement de la theorie de description du systeme, mais rend faisable 
la modelisation et la simulation des procedes de fermentation ; 

• Dans la modelisation cinetique, les valeurs des parametres du modele ont une 
signification physique, contiennent toujours les consequences des suppositions 
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introduites et des simplifications du fait de la complexity du cycle de fermentation, alors 
que les modeles neuronaux sont libres de ces dernieres ; 

• La modelisation par reseau de neurones est une methode qui est basee seulement sur des 
donnees experimentales et/ou semi-experimentales (deduites des modeles analytiques, 
empiriques, numeriques, ...), done la qualite et la quantite de donnees decident de 
fexactitude et la robustesse du modele ; 

• Les reseaux de neurones peuvent etre tres robustes et performants meme en presence de 
peu de donnees experimentales a condition que ces dernieres soient statistiquement bien 
reparties dans le domaine d'entree du modele neuronal, ce qui est le cas avec le plan 
composite centre ; 

• Les formules mathematiques extraites des modeles neuronaux peuvent trouver des 
applications interessantes dans la prediction, l’optimisation et meme le controle des 
procedes de fermentation ; 

• La combinaison des reseaux de neurones avec Palgorithme d’OEP presente une bonne 
previsibilite et une bonne precision dans la prediction et foptimisation des bio-processus ; 

• L’approche "hybride" proposee pour foptimisation des conditions de culture de 
Pleurotus mutilus est suffisamment generate et peut ainsi etre tres utile pour optimiser 
d’autres bioprocedes ; 

• La performance de foptimisation des equations mathematiques, issues des modeles 
neuronaux, est strictement liee a la capacite de prediction et de generalisation des ces 
derniers. En effet plus le modele neuronal est performant plus son optimisation donne des 
resultats plus precis. Pour augmenter plus cette precision, le choix de Palgorithme 
d’optimisation le plus performant est necessaire ; 

• L’algorithme d’OEP peut constituer une alternative interessante non seulement aux 
algorithmes conventionnelles d’apprentissage des reseaux de neurones, mais aussi a 
P algorithme genetique dans foptimisation des modeles neuronaux, c’est ce qui justifte 
notre choix de Putilise dans la methodologie hybride proposee. Cependant, 
P inconvenient majeur qui accompagne P utilisation de Palgorithme d’OEP est le choix de 
la variante et le reglage des ses parametres qui relevent plus de Part que de la science ; 
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• La moderation neuronale peut servir comme une alternative interessante et flable aux 
modeles cinetiques dans la modelisation des procedes de fermentation. 

• Compte tenu qu’il n’y a pas de regie pour le choix du modele neuronal pour un probleme 
donne, la strategic d’essai et erreur devient parfois laborieuse. 


De ce travail de these ont emerge de nombreuses pistes de recherche qui feront l’objet de 
futurs travaux. Les perspectives concernent plus particulierement la modelisation d’autre bio- 
processus pour des fins de prediction, d’optimisation et de controle. Nous pouvons aussi etendre 
l’idee de ce travail a d’autres techniques recentes de modelisation et d’optimisation telle que les 
approches de modelisation types "boite grise” et d’autres meta-heuristiques d’optimisation 
(simulated annealing, bee colony optimization, 
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Lot N° 19 


Figure 1. Resultats de modelisation. 

(Les donnees experimentales (symboles) pour la biomasse (•), glucose (■) et pleuromutiline ( A); 
Les resultats de la modelisation par RNFF sont represents par des traits pleins et les resultats de la 

modelisation cinetique sont presents par des lignes en pointilles). 
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